Esegue una moltiplicazione della matrice quantizzata di "a" per la matrice "b" con aggiunta bias.
Gli input devono essere matrici bidimensionali e vettori di polarizzazione 1D. E la dimensione interna di "a" (dopo essere stata trasposta se "transpose_a" è diverso da zero) deve corrispondere alla dimensione esterna di "b" (dopo essere stata trasposta se "transposed_b" è diverso da zero). Quindi esegui l'operazione di aggiunta broadcast con valori di bias sul risultato della moltiplicazione della matrice. La dimensione dello sbieco deve corrispondere alla dimensione interna di "b".
Classi nidificate
classe | QuantizedMatMulWithBias.Options | Attributi facoltativi per QuantizedMatMulWithBias |
Costanti
Corda | OP_NAME | Il nome di questa operazione, come noto al motore principale di TensorFlow |
Metodi pubblici
statico <W estende TType > QuantizedMatMulWithBias <W> | create ( Scope scope, Operando <? estende TType > a, Operando <? estende TType > b, Operando <? estende TType > bias, Operando < TFloat32 > minA, Operando < TFloat32 > maxA, Operando < TFloat32 > minB, Operando < TFloat32 > maxB, Classe<W> Tuscita, Opzioni... opzioni) Metodo factory per creare una classe che racchiude una nuova operazione QuantizedMatMulWithBias. |
statico QuantizedMatMulWithBias.Options | inputQuantMode (stringa inputQuantMode) |
Uscita < TFloat32 > | massimizzare () Il valore float rappresentato dal valore di uscita quantizzato più alto. |
Uscita < TFloat32 > | minOut () Il valore float rappresentato dal valore di uscita quantizzato più basso. |
Uscita <W> | fuori () |
statico QuantizedMatMulWithBias.Options | trasposizioneA (trasposizione booleana) |
statico QuantizedMatMulWithBias.Options | transposeB (trasposizione booleana B) |
Metodi ereditati
Costanti
Stringa finale statica pubblica OP_NAME
Il nome di questa operazione, come noto al motore principale di TensorFlow
Metodi pubblici
public static QuantizedMatMulWithBias <W> create ( Scope scope, Operando <? estende TType > a, Operando <? estende TType > b, Operando <? estende TType > bias, Operando < TFloat32 > minA, Operando < TFloat32 > maxA, Operando < TFloat32 > minB, Operando < TFloat32 > maxB, Classe<W> Toutput, Opzioni... opzioni)
Metodo factory per creare una classe che racchiude una nuova operazione QuantizedMatMulWithBias.
Parametri
scopo | ambito attuale |
---|---|
UN | Una matrice da moltiplicare. Deve essere un tensore bidimensionale di tipo "quint8". |
B | Una matrice da moltiplicare e deve essere un tensore bidimensionale di tipo "qint8". |
pregiudizio | Un tensore di polarizzazione 1D con dimensioni corrispondenti alla dimensione interna di "b" (dopo essere stato trasposto se "transposed_b" è diverso da zero). |
minA | Il valore float rappresentato dal valore "a" quantizzato più basso. |
maxA | Il valore float rappresentato dal valore "a" quantizzato più alto. |
minB | Il valore float rappresentato dal valore "b" quantizzato più basso. |
maxB | Il valore float rappresentato dal valore "b" quantizzato più alto. |
opzioni | trasporta valori di attributi opzionali |
ritorna
- una nuova istanza di QuantizedMatMulWithBias
pubblico statico QuantizedMatMulWithBias.Options inputQuantMode (String inputQuantMode)
Parametri
inputQuantMode | Modalità di quantizzazione dei dati in ingresso. O MIN_FIRST (predefinito) o SCALED. |
---|
Uscita pubblica < TFloat32 > maxOut ()
Il valore float rappresentato dal valore di uscita quantizzato più alto.
Uscita pubblica < TFloat32 > minOut ()
Il valore float rappresentato dal valore di uscita quantizzato più basso.
public static QuantizedMatMulWithBias.Options transposeA (transposeA booleana)
Parametri
trasporreA | Se vero, "a" viene trasposto prima della moltiplicazione. |
---|
public static QuantizedMatMulWithBias.Options transposeB (transposeB booleano)
Parametri
trasporreB | Se vero, "b" viene trasposto prima della moltiplicazione. |
---|