QuantizedMatMulWithBiasAndReluAndRequantize

kelas akhir publik QuantizedMatMulWithBiasAndReluAndRequantize

Lakukan perkalian matriks terkuantisasi `a` dengan matriks `b` dengan bias add dan relu serta requantize fusion.

Inputnya harus berupa matriks dua dimensi dan vektor bias 1D. Dan dimensi dalam `a` (setelah dialihkan jika `transpose_a` bukan nol) harus cocok dengan dimensi luar `b` (setelah dialihkan jika `transpose_b` bukan nol). Kemudian melakukan operasi penjumlahan siaran dengan nilai bias pada hasil perkalian matriks. Ukuran bias harus sesuai dengan dimensi dalam `b`. Kemudian lakukan aktivasi relu untuk mendapatkan hasil non-negatif. Kemudian lakukan operasi rekuantisasi untuk mendapatkan hasil akhir uint8.

Kelas Bersarang

kelas QuantizedMatMulWithBiasAndReluAndRequantize.Options Atribut opsional untuk QuantizedMatMulWithBiasAndReluAndRequantize

Metode Publik

statis <W, T, U, V> QuantizedMatMulWithBiasAndReluAndRequantize <W>
buat ( Lingkup lingkup, Operand <T> a, Operand <U> b, Operand <V> bias, Operand <Float> minA, Operand <Float> maxA, Operand <Float> minB, Operand <Float> maxB, Operand <Float > minFreezedOutput, Operan <Float> maxFreezedOutput, Kelas<W> Toutput, Opsi... opsi)
Metode pabrik untuk membuat kelas yang membungkus operasi QuantizedMatMulWithBiasAndReluAndRequantize baru.
QuantizedMatMulWithBiasAndReluAndRequantize.Options statis
masukanQuantMode (String masukanQuantMode)
Keluaran <Mengambang>
maksimalOut ()
Nilai mengambang yang diwakili oleh nilai keluaran terkuantisasi tertinggi.
Keluaran <Mengambang>
menit Keluar ()
Nilai mengambang yang diwakili oleh nilai keluaran terkuantisasi terendah.
Keluaran <W>
keluar ()
QuantizedMatMulWithBiasAndReluAndRequantize.Options statis
transposeA (Boolean transposeA)
QuantizedMatMulWithBiasAndReluAndRequantize.Options statis
transposeB (Boolean transposeB)

Metode Warisan

Metode Publik

public static QuantizedMatMulWithBiasAndReluAndRequantize <W> buat ( Lingkup lingkup, Operand <T> a, Operand <U> b, Operand <V> bias, Operand <Float> minA, Operand <Float> maxA, Operand <Float> minB, Operand <Float > maxB, Operan <Float> minFreezedOutput, Operan <Float> maxFreezedOutput, Kelas<W> Toutput, Opsi... opsi)

Metode pabrik untuk membuat kelas yang membungkus operasi QuantizedMatMulWithBiasAndReluAndRequantize baru.

Parameter
cakupan ruang lingkup saat ini
A Matriks yang akan dikalikan. Harus berupa tensor dua dimensi dengan tipe `quint8`.
B Matriks yang akan dikalikan harus berupa tensor dua dimensi bertipe `qint8`.
bias Tensor bias 1D dengan ukuran yang cocok dengan dimensi dalam `b` (setelah dialihkan jika `transpose_b` bukan nol).
minA Nilai mengambang yang diwakili oleh nilai `a` terkuantisasi terendah.
maksA Nilai float yang diwakili oleh nilai `a` terkuantisasi tertinggi.
menitB Nilai mengambang yang diwakili oleh nilai `b` terkuantisasi terendah.
maksB Nilai float yang diwakili oleh nilai `b` terkuantisasi tertinggi.
menitFreezedOutput Nilai float yang merupakan nilai keluaran terkuantisasi tertinggi setelah dikuantisasi ulang.
pilihan membawa nilai atribut opsional
Kembali
  • contoh baru QuantizedMatMulWithBiasAndReluAndRequantize

public static QuantizedMatMulWithBiasAndReluAndRequantize.Options inputQuantMode (String inputQuantMode)

Parameter
masukanQuantMode Mode kuantisasi data masukan. MIN_FIRST(default) atau SCALED.

Keluaran publik <Float> maxOut ()

Nilai mengambang yang diwakili oleh nilai keluaran terkuantisasi tertinggi.

Keluaran publik <Float> minOut ()

Nilai mengambang yang diwakili oleh nilai keluaran terkuantisasi terendah.

Keluaran publik <W> keluar ()

public static QuantizedMatMulWithBiasAndReluAndRequantize.Options transposeA (Boolean transposeA)

Parameter
mengubah urutanA Jika benar, `a` dialihkan sebelum perkalian.

public static QuantizedMatMulWithBiasAndReluAndRequantize.Options transposeB (Boolean transposeB)

Parameter
mengubah urutanB Jika benar, `b` dialihkan sebelum perkalian.