Lakukan perkalian matriks terkuantisasi dari `a` dengan matriks `b` dengan bias add dan relu dan requantize fusion.
Input harus berupa matriks dua dimensi dan vektor bias 1D. Dan dimensi dalam `a` (setelah ditransposisikan jika `transpose_a` bukan nol) harus cocok dengan dimensi luar `b` (setelah ditransposisikan jika `transpose_b` bukan nol). Kemudian dilakukan operasi broadcast add dengan nilai bias pada hasil perkalian matriks. Ukuran bias harus cocok dengan dimensi dalam `b`. Kemudian lakukan aktivasi relu untuk mendapatkan hasil non-negatif. Kemudian lakukan operasi requantize untuk mendapatkan hasil akhir uint8.
Kelas Bersarang
kelas | QuantizedMatMulWithBiasAndReluAndRequantize.Options | Atribut opsional untuk QuantizedMatMulWithBiasAndReluAndRequantize |
Metode Publik
statis <W, T, U, V> QuantizedMatMulWithBiasAndReluAndRequantize <W> | membuat ( Lingkup lingkup, Operan <T> a, Operan <U> b, Operan <V> Bias, Operan <Lampung> minA, Operan <Lampung> maxA, Operan <Lampung> minB, Operan <Lampung> maxB, Operan <Lampung > minFreezedOutput, Operan <Lampung> maxFreezedOutput, Kelas <W> Toutput, Options ... pilihan) Metode pabrik untuk membuat kelas yang membungkus operasi QuantizedMatMulWithBiasAndReluAndRequantize baru. |
statis QuantizedMatMulWithBiasAndReluAndRequantize.Options | inputQuantMode (String inputQuantMode) |
Output <Lampung> | maxOut () Nilai float yang diwakili oleh nilai output terkuantisasi tertinggi. |
Output <Lampung> | minOut () Nilai float yang diwakili oleh nilai keluaran terkuantisasi terendah. |
Output <W> | keluar () |
statis QuantizedMatMulWithBiasAndReluAndRequantize.Options | transposeA (Boolean transposeA) |
statis QuantizedMatMulWithBiasAndReluAndRequantize.Options | transposeB (Boolean transposeB) |
Metode yang Diwarisi
Metode Publik
public static QuantizedMatMulWithBiasAndReluAndRequantize <W> membuat ( Lingkup lingkup, Operan <T> a, Operan <U> b, Operan <V> Bias, Operan <Lampung> minA, Operan <Lampung> maxA, Operan <Lampung> minB, Operan <Lampung > maxB, Operan <Lampung> minFreezedOutput, Operan <Lampung> maxFreezedOutput, Kelas <W> Toutput, Options ... pilihan)
Metode pabrik untuk membuat kelas yang membungkus operasi QuantizedMatMulWithBiasAndReluAndRequantize baru.
Parameter
cakupan | lingkup saat ini |
---|---|
A | Matriks yang akan dikalikan. Harus berupa tensor dua dimensi dengan tipe `quint8`. |
B | Matriks yang akan dikalikan dan harus berupa tensor dua dimensi dengan tipe `qint8`. |
bias | Tensor bias 1D dengan ukuran yang cocok dengan dimensi dalam `b` (setelah ditransposisikan jika `transposed_b` bukan nol). |
minA | Nilai float yang diwakili oleh nilai `a` terkuantisasi terendah. |
maksA | Nilai float yang diwakili oleh nilai `a` terkuantisasi tertinggi. |
minB | Nilai float yang diwakili oleh nilai `b` terkuantisasi terendah. |
maksB | Nilai float yang diwakili oleh nilai `b` terkuantisasi tertinggi. |
minBekukanOutput | Nilai float yang merupakan nilai output terkuantisasi tertinggi setelah requantize. |
pilihan | membawa nilai atribut opsional |
Kembali
- contoh baru QuantizedMatMulWithBiasAndReluAndRequantize
public static QuantizedMatMulWithBiasAndReluAndRequantize.Options inputQuantMode (String inputQuantMode)
Parameter
masukanQuantMode | Mode kuantisasi data masukan. Baik MIN_FIRST(default) atau SCALED. |
---|
publik Keluaran <Lampung> maxOut ()
Nilai float yang diwakili oleh nilai output terkuantisasi tertinggi.
publik Keluaran <Lampung> minOut ()
Nilai float yang diwakili oleh nilai keluaran terkuantisasi terendah.
public static QuantizedMatMulWithBiasAndReluAndRequantize.Options transposeA (Boolean transposeA)
Parameter
transposA | Jika benar, `a` ditransposisikan sebelum perkalian. |
---|
public static QuantizedMatMulWithBiasAndReluAndRequantize.Options transposeB (Boolean transposeB)
Parameter
transposB | Jika benar, `b` ditransposisikan sebelum perkalian. |
---|