Melakukan perkalian matriks terkuantisasi `a` dengan matriks `b` dengan penambahan bias.
Inputnya harus berupa matriks dua dimensi dan vektor bias 1D. Dan dimensi dalam `a` (setelah dialihkan jika `transpose_a` bukan nol) harus cocok dengan dimensi luar `b` (setelah dialihkan jika `transpose_b` bukan nol). Kemudian melakukan operasi penjumlahan siaran dengan nilai bias pada hasil perkalian matriks. Ukuran bias harus sesuai dengan dimensi dalam `b`.
Kelas Bersarang
kelas | QuantizedMatMulWithBias.Options | Atribut opsional untuk QuantizedMatMulWithBias |
Metode Publik
statis <W, T, U, V> QuantizedMatMulWithBias <W> | |
QuantizedMatMulWithBias.Options statis | masukanQuantMode (String masukanQuantMode) |
Keluaran <Mengambang> | maksimalOut () Nilai mengambang yang diwakili oleh nilai keluaran terkuantisasi tertinggi. |
Keluaran <Mengambang> | menit Keluar () Nilai mengambang yang diwakili oleh nilai keluaran terkuantisasi terendah. |
Keluaran <W> | keluar () |
QuantizedMatMulWithBias.Options statis | transposeA (Boolean transposeA) |
QuantizedMatMulWithBias.Options statis | transposeB (Boolean transposeB) |
Metode Warisan
Metode Publik
public static QuantizedMatMulWithBias <W> buat ( Ruang lingkup, Operan <T> a, Operan <U> b, Operan <V> bias, Operan <Float> minA, Operan <Float> maxA, Operan <Float> minB, Operan <Float > maxB, Kelas<W> Toutput, Opsi... opsi)
Metode pabrik untuk membuat kelas yang membungkus operasi QuantizedMatMulWithBias baru.
Parameter
cakupan | ruang lingkup saat ini |
---|---|
A | Matriks yang akan dikalikan. Harus berupa tensor dua dimensi dengan tipe `quint8`. |
B | Matriks yang akan dikalikan harus berupa tensor dua dimensi bertipe `qint8`. |
bias | Tensor bias 1D dengan dimensi dalam yang cocok dengan ukuran `b` (setelah dialihkan jika `transpose_b` bukan nol). |
minA | Nilai mengambang yang diwakili oleh nilai `a` terkuantisasi terendah. |
maksA | Nilai float yang diwakili oleh nilai `a` terkuantisasi tertinggi. |
menitB | Nilai mengambang yang diwakili oleh nilai `b` terkuantisasi terendah. |
maksB | Nilai float yang diwakili oleh nilai `b` terkuantisasi tertinggi. |
pilihan | membawa nilai atribut opsional |
Kembali
- contoh baru QuantizedMatMulWithBias
public static QuantizedMatMulWithBias.Options inputQuantMode (String inputQuantMode)
Parameter
masukanQuantMode | Mode kuantisasi data masukan. MIN_FIRST(default) atau SCALED. |
---|
Keluaran publik <Float> maxOut ()
Nilai mengambang yang diwakili oleh nilai keluaran terkuantisasi tertinggi.
Keluaran publik <Float> minOut ()
Nilai mengambang yang diwakili oleh nilai keluaran terkuantisasi terendah.
public static QuantizedMatMulWithBias.Options transposeA (Boolean transposeA)
Parameter
mengubah urutanA | Jika benar, `a` dialihkan sebelum perkalian. |
---|
public static QuantizedMatMulWithBias.Options transposeB (Boolean transposeB)
Parameter
mengubah urutanB | Jika benar, `b` dialihkan sebelum perkalian. |
---|