QuantizedMatMulWithBiasAndRelu

kelas akhir publik QuantizedMatMulWithBiasAndRelu

Lakukan perkalian matriks terkuantisasi `a` dengan matriks `b` dengan penjumlahan bias dan fusi relu.

Inputnya harus berupa matriks dua dimensi dan vektor bias 1D. Dan dimensi dalam `a` (setelah dialihkan jika `transpose_a` bukan nol) harus cocok dengan dimensi luar `b` (setelah dialihkan jika `transpose_b` bukan nol). Kemudian melakukan operasi penjumlahan siaran dengan nilai bias pada hasil perkalian matriks. Ukuran bias harus sesuai dengan dimensi dalam `b`. Kemudian lakukan aktivasi relu untuk mendapatkan hasil non-negatif.

Kelas Bersarang

kelas QuantizedMatMulWithBiasAndRelu.Options Atribut opsional untuk QuantizedMatMulWithBiasAndRelu

Metode Publik

statis <V, T, U> QuantizedMatMulWithBiasAndRelu <V>
buat ( Lingkup lingkup, Operand <T> a, Operand <U> b, Operand <Float> bias, Operand <Float> minA, Operand <Float> maxA, Operand <Float> minB, Operand <Float> maxB, Class<V > Keluaran, Opsi... opsi)
Metode pabrik untuk membuat kelas yang membungkus operasi QuantizedMatMulWithBiasAndRelu baru.
QuantizedMatMulWithBiasAndRelu.Options statis
masukanQuantMode (String masukanQuantMode)
Keluaran <Mengambang>
maksimalOut ()
Nilai mengambang yang diwakili oleh nilai keluaran terkuantisasi tertinggi.
Keluaran <Mengambang>
menit Keluar ()
Nilai mengambang yang diwakili oleh nilai keluaran terkuantisasi terendah.
Keluaran <V>
keluar ()
QuantizedMatMulWithBiasAndRelu.Options statis
transposeA (Boolean transposeA)
QuantizedMatMulWithBiasAndRelu.Options statis
transposeB (Boolean transposeB)

Metode Warisan

Metode Publik

public static QuantizedMatMulWithBiasAndRelu <V> buat ( Lingkup lingkup, Operand <T> a, Operand <U> b, Operand <Float> bias, Operand <Float> minA, Operand <Float> maxA, Operand <Float> minB, Operand <Float > maxB, Kelas<V> Keluaran, Opsi... opsi)

Metode pabrik untuk membuat kelas yang membungkus operasi QuantizedMatMulWithBiasAndRelu baru.

Parameter
cakupan ruang lingkup saat ini
A Matriks yang akan dikalikan. Harus berupa tensor dua dimensi dengan tipe `quint8`.
B Matriks yang akan dikalikan harus berupa tensor dua dimensi bertipe `qint8`.
bias Tensor bias 1D dengan ukuran yang cocok dengan dimensi dalam `b` (setelah dialihkan jika `transpose_b` bukan nol).
minA Nilai mengambang yang diwakili oleh nilai `a` terkuantisasi terendah.
maksA Nilai float yang diwakili oleh nilai `a` terkuantisasi tertinggi.
menitB Nilai mengambang yang diwakili oleh nilai `b` terkuantisasi terendah.
maksB Nilai float yang diwakili oleh nilai `b` terkuantisasi tertinggi.
pilihan membawa nilai atribut opsional
Kembali
  • contoh baru QuantizedMatMulWithBiasAndRelu

public static QuantizedMatMulWithBiasAndRelu.Options inputQuantMode (String inputQuantMode)

Parameter
masukanQuantMode Mode kuantisasi data masukan. MIN_FIRST(default) atau SCALED.

Keluaran publik <Float> maxOut ()

Nilai mengambang yang diwakili oleh nilai keluaran terkuantisasi tertinggi.

Keluaran publik <Float> minOut ()

Nilai mengambang yang diwakili oleh nilai keluaran terkuantisasi terendah.

Keluaran publik <V> keluar ()

public static QuantizedMatMulWithBiasAndRelu.Options transposeA (Boolean transposeA)

Parameter
mengubah urutanA Jika benar, `a` dialihkan sebelum perkalian.

public static QuantizedMatMulWithBiasAndRelu.Options transposeB (Boolean transposeB)

Parameter
mengubah urutanB Jika benar, `b` dialihkan sebelum perkalian.