Lakukan perkalian matriks terkuantisasi `a` dengan matriks `b` dengan bias add dan relu serta requantize fusion.
Inputnya harus berupa matriks dua dimensi dan vektor bias 1D. Dan dimensi dalam `a` (setelah dialihkan jika `transpose_a` bukan nol) harus cocok dengan dimensi luar `b` (setelah dialihkan jika `transpose_b` bukan nol). Kemudian melakukan operasi penjumlahan siaran dengan nilai bias pada hasil perkalian matriks. Ukuran bias harus sesuai dengan dimensi dalam `b`. Kemudian lakukan aktivasi relu untuk mendapatkan hasil non-negatif. Kemudian lakukan operasi rekuantisasi untuk mendapatkan hasil akhir uint8.
Kelas Bersarang
kelas | QuantizedMatMulWithBiasAndReluAndRequantize.Options | Atribut opsional untuk QuantizedMatMulWithBiasAndReluAndRequantize |
Konstanta
Rangkaian | OP_NAME | Nama operasi ini dikenal dengan mesin inti TensorFlow |
Metode Publik
statis <W extends TType > QuantizedMatMulWithBiasAndReluAndRequantize <W> | buat ( Lingkup lingkup, Operand <? extends TType > a, Operand <? extends TType > b, Operand <? extends TType > bias, Operand < TFloat32 > minA, Operand < TFloat32 > maxA, Operand < TFloat32 > minB, Operand < TFloat32 > maxB, Operan < TFloat32 > minFreezedOutput, Operan < TFloat32 > maxFreezedOutput, Kelas<W> Toutput, Opsi... opsi) Metode pabrik untuk membuat kelas yang membungkus operasi QuantizedMatMulWithBiasAndReluAndRequantize baru. |
QuantizedMatMulWithBiasAndReluAndRequantize.Options statis | masukanQuantMode (String masukanQuantMode) |
Keluaran < TFloat32 > | maksimalOut () Nilai mengambang yang diwakili oleh nilai keluaran terkuantisasi tertinggi. |
Keluaran < TFloat32 > | menit Keluar () Nilai mengambang yang diwakili oleh nilai keluaran terkuantisasi terendah. |
Keluaran <W> | keluar () |
QuantizedMatMulWithBiasAndReluAndRequantize.Options statis | transposeA (Boolean transposeA) |
QuantizedMatMulWithBiasAndReluAndRequantize.Options statis | transposeB (Boolean transposeB) |
Metode Warisan
Konstanta
String akhir statis publik OP_NAME
Nama operasi ini dikenal dengan mesin inti TensorFlow
Metode Publik
public static QuantizedMatMulWithBiasAndReluAndRequantize <W> buat ( Lingkup lingkup, Operan <? extends TType > a, Operand <? extends TType > b, Operand <? extends TType > bias, Operand < TFloat32 > minA, Operand < TFloat32 > maxA, Operand < TFloat32 > minB, Operan < TFloat32 > maxB, Operan < TFloat32 > minFreezedOutput, Operan < TFloat32 > maxFreezedOutput, Kelas<W> Toutput, Opsi... opsi)
Metode pabrik untuk membuat kelas yang membungkus operasi QuantizedMatMulWithBiasAndReluAndRequantize baru.
Parameter
cakupan | ruang lingkup saat ini |
---|---|
A | Matriks yang akan dikalikan. Harus berupa tensor dua dimensi dengan tipe `quint8`. |
B | Matriks yang akan dikalikan harus berupa tensor dua dimensi bertipe `qint8`. |
bias | Tensor bias 1D dengan ukuran yang cocok dengan dimensi dalam `b` (setelah dialihkan jika `transpose_b` bukan nol). |
minA | Nilai mengambang yang diwakili oleh nilai `a` terkuantisasi terendah. |
maksA | Nilai float yang diwakili oleh nilai `a` terkuantisasi tertinggi. |
menitB | Nilai mengambang yang diwakili oleh nilai `b` terkuantisasi terendah. |
maksB | Nilai float yang diwakili oleh nilai `b` terkuantisasi tertinggi. |
menitFreezedOutput | Nilai float yang merupakan nilai keluaran terkuantisasi tertinggi setelah dikuantisasi ulang. |
pilihan | membawa nilai atribut opsional |
Kembali
- contoh baru QuantizedMatMulWithBiasAndReluAndRequantize
public static QuantizedMatMulWithBiasAndReluAndRequantize.Options inputQuantMode (String inputQuantMode)
Parameter
masukanQuantMode | Mode kuantisasi data masukan. MIN_FIRST(default) atau SCALED. |
---|
Keluaran publik < TFloat32 > maxOut ()
Nilai mengambang yang diwakili oleh nilai keluaran terkuantisasi tertinggi.
Keluaran publik < TFloat32 > minOut ()
Nilai mengambang yang diwakili oleh nilai keluaran terkuantisasi terendah.
public static QuantizedMatMulWithBiasAndReluAndRequantize.Options transposeA (Boolean transposeA)
Parameter
mengubah urutanA | Jika benar, `a` dialihkan sebelum perkalian. |
---|
public static QuantizedMatMulWithBiasAndReluAndRequantize.Options transposeB (Boolean transposeB)
Parameter
mengubah urutanB | Jika benar, `b` dialihkan sebelum perkalian. |
---|