QuantizedMatMulWithBias

kelas akhir publik QuantizedMatMulWithBias

Melakukan perkalian matriks terkuantisasi `a` dengan matriks `b` dengan penambahan bias.

Inputnya harus berupa matriks dua dimensi dan vektor bias 1D. Dan dimensi dalam `a` (setelah dialihkan jika `transpose_a` bukan nol) harus cocok dengan dimensi luar `b` (setelah dialihkan jika `transpose_b` bukan nol). Kemudian melakukan operasi penjumlahan siaran dengan nilai bias pada hasil perkalian matriks. Ukuran bias harus sesuai dengan dimensi dalam `b`.

Kelas Bersarang

kelas QuantizedMatMulWithBias.Options Atribut opsional untuk QuantizedMatMulWithBias

Metode Publik

statis <W, T, U, V> QuantizedMatMulWithBias <W>
buat ( Lingkup lingkup, Operand <T> a, Operand <U> b, Operand <V> bias, Operand <Float> minA, Operand <Float> maxA, Operand <Float> minB, Operand <Float> maxB, Class<W > Keluaran, Opsi... opsi)
Metode pabrik untuk membuat kelas yang membungkus operasi QuantizedMatMulWithBias baru.
QuantizedMatMulWithBias.Options statis
masukanQuantMode (String masukanQuantMode)
Keluaran <Mengambang>
maksimalOut ()
Nilai mengambang yang diwakili oleh nilai keluaran terkuantisasi tertinggi.
Keluaran <Mengambang>
menit Keluar ()
Nilai mengambang yang diwakili oleh nilai keluaran terkuantisasi terendah.
Keluaran <W>
keluar ()
QuantizedMatMulWithBias.Options statis
transposeA (Boolean transposeA)
QuantizedMatMulWithBias.Options statis
transposeB (Boolean transposeB)

Metode Warisan

Metode Publik

public static QuantizedMatMulWithBias <W> buat ( Ruang lingkup, Operan <T> a, Operan <U> b, Operan <V> bias, Operan <Float> minA, Operan <Float> maxA, Operan <Float> minB, Operan <Float > maxB, Kelas<W> Toutput, Opsi... opsi)

Metode pabrik untuk membuat kelas yang membungkus operasi QuantizedMatMulWithBias baru.

Parameter
cakupan ruang lingkup saat ini
A Matriks yang akan dikalikan. Harus berupa tensor dua dimensi dengan tipe `quint8`.
B Matriks yang akan dikalikan harus berupa tensor dua dimensi bertipe `qint8`.
bias Tensor bias 1D dengan dimensi dalam yang cocok dengan ukuran `b` (setelah dialihkan jika `transpose_b` bukan nol).
minA Nilai mengambang yang diwakili oleh nilai `a` terkuantisasi terendah.
maksA Nilai float yang diwakili oleh nilai `a` terkuantisasi tertinggi.
menitB Nilai mengambang yang diwakili oleh nilai `b` terkuantisasi terendah.
maksB Nilai float yang diwakili oleh nilai `b` terkuantisasi tertinggi.
pilihan membawa nilai atribut opsional
Kembali
  • contoh baru QuantizedMatMulWithBias

public static QuantizedMatMulWithBias.Options inputQuantMode (String inputQuantMode)

Parameter
masukanQuantMode Mode kuantisasi data masukan. MIN_FIRST(default) atau SCALED.

Keluaran publik <Float> maxOut ()

Nilai mengambang yang diwakili oleh nilai keluaran terkuantisasi tertinggi.

Keluaran publik <Float> minOut ()

Nilai mengambang yang diwakili oleh nilai keluaran terkuantisasi terendah.

Keluaran publik <W> keluar ()

public static QuantizedMatMulWithBias.Options transposeA (Boolean transposeA)

Parameter
mengubah urutanA Jika benar, `a` dialihkan sebelum perkalian.

public static QuantizedMatMulWithBias.Options transposeB (Boolean transposeB)

Parameter
mengubah urutanB Jika benar, `b` dialihkan sebelum perkalian.