Lakukan perkalian matriks terkuantisasi `a` dengan matriks `b` dengan penjumlahan bias dan fusi relu.
Inputnya harus berupa matriks dua dimensi dan vektor bias 1D. Dan dimensi dalam `a` (setelah dialihkan jika `transpose_a` bukan nol) harus cocok dengan dimensi luar `b` (setelah dialihkan jika `transpose_b` bukan nol). Kemudian melakukan operasi penjumlahan siaran dengan nilai bias pada hasil perkalian matriks. Ukuran bias harus sesuai dengan dimensi dalam `b`. Kemudian lakukan aktivasi relu untuk mendapatkan hasil non-negatif.
Kelas Bersarang
kelas | QuantizedMatMulWithBiasAndRelu.Options | Atribut opsional untuk QuantizedMatMulWithBiasAndRelu |
Metode Publik
statis <V, T, U> QuantizedMatMulWithBiasAndRelu <V> | |
QuantizedMatMulWithBiasAndRelu.Options statis | masukanQuantMode (String masukanQuantMode) |
Keluaran <Mengambang> | maksimalOut () Nilai mengambang yang diwakili oleh nilai keluaran terkuantisasi tertinggi. |
Keluaran <Mengambang> | menit Keluar () Nilai mengambang yang diwakili oleh nilai keluaran terkuantisasi terendah. |
Keluaran <V> | keluar () |
QuantizedMatMulWithBiasAndRelu.Options statis | transposeA (Boolean transposeA) |
QuantizedMatMulWithBiasAndRelu.Options statis | transposeB (Boolean transposeB) |
Metode Warisan
Metode Publik
public static QuantizedMatMulWithBiasAndRelu <V> buat ( Lingkup lingkup, Operand <T> a, Operand <U> b, Operand <Float> bias, Operand <Float> minA, Operand <Float> maxA, Operand <Float> minB, Operand <Float > maxB, Kelas<V> Keluaran, Opsi... opsi)
Metode pabrik untuk membuat kelas yang membungkus operasi QuantizedMatMulWithBiasAndRelu baru.
Parameter
cakupan | ruang lingkup saat ini |
---|---|
A | Matriks yang akan dikalikan. Harus berupa tensor dua dimensi dengan tipe `quint8`. |
B | Matriks yang akan dikalikan harus berupa tensor dua dimensi bertipe `qint8`. |
bias | Tensor bias 1D dengan ukuran yang cocok dengan dimensi dalam `b` (setelah dialihkan jika `transpose_b` bukan nol). |
minA | Nilai mengambang yang diwakili oleh nilai `a` terkuantisasi terendah. |
maksA | Nilai float yang diwakili oleh nilai `a` terkuantisasi tertinggi. |
menitB | Nilai mengambang yang diwakili oleh nilai `b` terkuantisasi terendah. |
maksB | Nilai float yang diwakili oleh nilai `b` terkuantisasi tertinggi. |
pilihan | membawa nilai atribut opsional |
Kembali
- contoh baru QuantizedMatMulWithBiasAndRelu
public static QuantizedMatMulWithBiasAndRelu.Options inputQuantMode (String inputQuantMode)
Parameter
masukanQuantMode | Mode kuantisasi data masukan. MIN_FIRST(default) atau SCALED. |
---|
Keluaran publik <Float> maxOut ()
Nilai mengambang yang diwakili oleh nilai keluaran terkuantisasi tertinggi.
Keluaran publik <Float> minOut ()
Nilai mengambang yang diwakili oleh nilai keluaran terkuantisasi terendah.
public static QuantizedMatMulWithBiasAndRelu.Options transposeA (Boolean transposeA)
Parameter
mengubah urutanA | Jika benar, `a` dialihkan sebelum perkalian. |
---|
public static QuantizedMatMulWithBiasAndRelu.Options transposeB (Boolean transposeB)
Parameter
mengubah urutanB | Jika benar, `b` dialihkan sebelum perkalian. |
---|