Lakukan perkalian matriks terkuantisasi `a` dengan matriks `b` dengan bias add dan relu serta requantize fusion.
Inputnya harus berupa matriks dua dimensi dan vektor bias 1D. Dan dimensi dalam `a` (setelah dialihkan jika `transpose_a` bukan nol) harus cocok dengan dimensi luar `b` (setelah dialihkan jika `transpose_b` bukan nol). Kemudian melakukan operasi penjumlahan siaran dengan nilai bias pada hasil perkalian matriks. Ukuran bias harus sesuai dengan dimensi dalam `b`. Kemudian lakukan aktivasi relu untuk mendapatkan hasil non-negatif. Kemudian lakukan operasi rekuantisasi untuk mendapatkan hasil akhir uint8.
Kelas Bersarang
kelas | QuantizedMatMulWithBiasAndReluAndRequantize.Options | Atribut opsional untuk QuantizedMatMulWithBiasAndReluAndRequantize |
Metode Publik
statis <W, T, U, V> QuantizedMatMulWithBiasAndReluAndRequantize <W> | buat ( Lingkup lingkup, Operand <T> a, Operand <U> b, Operand <V> bias, Operand <Float> minA, Operand <Float> maxA, Operand <Float> minB, Operand <Float> maxB, Operand <Float > minFreezedOutput, Operan <Float> maxFreezedOutput, Kelas<W> Toutput, Opsi... opsi) Metode pabrik untuk membuat kelas yang membungkus operasi QuantizedMatMulWithBiasAndReluAndRequantize baru. |
QuantizedMatMulWithBiasAndReluAndRequantize.Options statis | masukanQuantMode (String masukanQuantMode) |
Keluaran <Mengambang> | maksimalOut () Nilai mengambang yang diwakili oleh nilai keluaran terkuantisasi tertinggi. |
Keluaran <Mengambang> | menit Keluar () Nilai mengambang yang diwakili oleh nilai keluaran terkuantisasi terendah. |
Keluaran <W> | keluar () |
QuantizedMatMulWithBiasAndReluAndRequantize.Options statis | transposeA (Boolean transposeA) |
QuantizedMatMulWithBiasAndReluAndRequantize.Options statis | transposeB (Boolean transposeB) |
Metode Warisan
Metode Publik
public static QuantizedMatMulWithBiasAndReluAndRequantize <W> buat ( Lingkup lingkup, Operand <T> a, Operand <U> b, Operand <V> bias, Operand <Float> minA, Operand <Float> maxA, Operand <Float> minB, Operand <Float > maxB, Operan <Float> minFreezedOutput, Operan <Float> maxFreezedOutput, Kelas<W> Toutput, Opsi... opsi)
Metode pabrik untuk membuat kelas yang membungkus operasi QuantizedMatMulWithBiasAndReluAndRequantize baru.
Parameter
cakupan | ruang lingkup saat ini |
---|---|
A | Matriks yang akan dikalikan. Harus berupa tensor dua dimensi dengan tipe `quint8`. |
B | Matriks yang akan dikalikan harus berupa tensor dua dimensi bertipe `qint8`. |
bias | Tensor bias 1D dengan ukuran yang cocok dengan dimensi dalam `b` (setelah dialihkan jika `transpose_b` bukan nol). |
minA | Nilai mengambang yang diwakili oleh nilai `a` terkuantisasi terendah. |
maksA | Nilai float yang diwakili oleh nilai `a` terkuantisasi tertinggi. |
menitB | Nilai mengambang yang diwakili oleh nilai `b` terkuantisasi terendah. |
maksB | Nilai float yang diwakili oleh nilai `b` terkuantisasi tertinggi. |
menitFreezedOutput | Nilai float yang merupakan nilai keluaran terkuantisasi tertinggi setelah dikuantisasi ulang. |
pilihan | membawa nilai atribut opsional |
Kembali
- contoh baru QuantizedMatMulWithBiasAndReluAndRequantize
public static QuantizedMatMulWithBiasAndReluAndRequantize.Options inputQuantMode (String inputQuantMode)
Parameter
masukanQuantMode | Mode kuantisasi data masukan. MIN_FIRST(default) atau SCALED. |
---|
Keluaran publik <Float> maxOut ()
Nilai mengambang yang diwakili oleh nilai keluaran terkuantisasi tertinggi.
Keluaran publik <Float> minOut ()
Nilai mengambang yang diwakili oleh nilai keluaran terkuantisasi terendah.
public static QuantizedMatMulWithBiasAndReluAndRequantize.Options transposeA (Boolean transposeA)
Parameter
mengubah urutanA | Jika benar, `a` dialihkan sebelum perkalian. |
---|
public static QuantizedMatMulWithBiasAndReluAndRequantize.Options transposeB (Boolean transposeB)
Parameter
mengubah urutanB | Jika benar, `b` dialihkan sebelum perkalian. |
---|