Lakukan perkalian matriks terkuantisasi dari `a` dengan matriks `b` dengan bias tambah dan relu fusi.
Input harus berupa matriks dua dimensi dan vektor bias 1D. Dan dimensi dalam `a` (setelah ditransposisikan jika `transpose_a` bukan nol) harus cocok dengan dimensi luar `b` (setelah ditransposisikan jika `transposed_b` bukan nol). Kemudian dilakukan operasi broadcast add dengan nilai bias pada hasil perkalian matriks. Ukuran bias harus cocok dengan dimensi dalam `b`. Kemudian lakukan aktivasi relu untuk mendapatkan hasil non-negatif.
Kelas Bersarang
kelas | QuantizedMatMulWithBiasAndRelu.Options | Atribut opsional untuk QuantizedMatMulWithBiasAndRelu |
Metode Publik
statis <V, T, U> QuantizedMatMulWithBiasAndRelu <V> | membuat ( Lingkup lingkup, Operan <T> a, Operan <U> b, Operan <Lampung> Bias, Operan <Lampung> minA, Operan <Lampung> maxA, Operan <Lampung> minB, Operan <Lampung> maxB, Kelas <V > Toutput, Options ... pilihan) Metode pabrik untuk membuat kelas yang membungkus operasi QuantizedMatMulWithBiasAndRelu baru. |
statis QuantizedMatMulWithBiasAndRelu.Options | inputQuantMode (String inputQuantMode) |
Output <Lampung> | maxOut () Nilai float yang diwakili oleh nilai output terkuantisasi tertinggi. |
Output <Lampung> | minOut () Nilai float yang diwakili oleh nilai keluaran terkuantisasi terendah. |
Output <V> | keluar () |
statis QuantizedMatMulWithBiasAndRelu.Options | transposeA (Boolean transposeA) |
statis QuantizedMatMulWithBiasAndRelu.Options | transposeB (Boolean transposeB) |
Metode yang Diwarisi
Metode Publik
public static QuantizedMatMulWithBiasAndRelu <V> membuat ( Lingkup lingkup, Operan <T> a, Operan <U> b, Operan <Lampung> Bias, Operan <Lampung> minA, Operan <Lampung> maxA, Operan <Lampung> minB, Operan <Lampung > maxB, Kelas <V> Toutput, Options ... pilihan)
Metode pabrik untuk membuat kelas yang membungkus operasi QuantizedMatMulWithBiasAndRelu baru.
Parameter
cakupan | lingkup saat ini |
---|---|
A | Matriks yang akan dikalikan. Harus berupa tensor dua dimensi dengan tipe `quint8`. |
B | Matriks yang akan dikalikan dan harus berupa tensor dua dimensi dengan tipe `qint8`. |
bias | Tensor bias 1D dengan ukuran yang cocok dengan dimensi dalam `b` (setelah ditransposisikan jika `transposed_b` bukan nol). |
minA | Nilai float yang diwakili oleh nilai `a` terkuantisasi terendah. |
maksA | Nilai float yang diwakili oleh nilai `a` terkuantisasi tertinggi. |
minB | Nilai float yang diwakili oleh nilai `b` terkuantisasi terendah. |
maksB | Nilai float yang diwakili oleh nilai `b` terkuantisasi tertinggi. |
pilihan | membawa nilai atribut opsional |
Kembali
- contoh baru QuantizedMatMulWithBiasAndRelu
public static QuantizedMatMulWithBiasAndRelu.Options inputQuantMode (String inputQuantMode)
Parameter
masukanQuantMode | Mode kuantisasi data masukan. Baik MIN_FIRST(default) atau SCALED. |
---|
publik Keluaran <Lampung> maxOut ()
Nilai float yang diwakili oleh nilai output terkuantisasi tertinggi.
publik Keluaran <Lampung> minOut ()
Nilai float yang diwakili oleh nilai keluaran terkuantisasi terendah.
public static QuantizedMatMulWithBiasAndRelu.Options transposeA (Boolean transposeA)
Parameter
transposA | Jika benar, `a` ditransposisikan sebelum perkalian. |
---|
public static QuantizedMatMulWithBiasAndRelu.Options transposeB (Boolean transposeB)
Parameter
transposB | Jika benar, `b` ditransposisikan sebelum perkalian. |
---|