QuantizedMatMulWithBiasAndReluAndRequantize

classe finale pubblica QuantizedMatMulWithBiasAndReluAndRequantize

Esegui una moltiplicazione della matrice quantizzata di "a" per la matrice "b" con aggiunta bias, relu e riquantizzazione della fusione.

Gli input devono essere matrici bidimensionali e vettori di polarizzazione 1D. E la dimensione interna di "a" (dopo essere stata trasposta se "transpose_a" è diverso da zero) deve corrispondere alla dimensione esterna di "b" (dopo essere stata trasposta se "transposed_b" è diverso da zero). Quindi esegui l'operazione di aggiunta broadcast con valori di bias sul risultato della moltiplicazione della matrice. La dimensione dello sbieco deve corrispondere alla dimensione interna di "b". Quindi eseguire l'attivazione relu per ottenere un risultato non negativo. Quindi esegui l'operazione di riquantizzazione per ottenere il risultato finale uint8.

Classi nidificate

classe QuantizedMatMulWithBiasAndReluAndRequantize.Options Attributi facoltativi per QuantizedMatMulWithBiasAndReluAndRequantize

Costanti

Corda OP_NAME Il nome di questa operazione, come noto al motore principale di TensorFlow

Metodi pubblici

statico <W estende TType > QuantizedMatMulWithBiasAndReluAndRequantize <W>
create ( Scope scope, Operando <? estende TType > a, Operando <? estende TType > b, Operando <? estende TType > bias, Operando < TFloat32 > minA, Operando < TFloat32 > maxA, Operando < TFloat32 > minB, Operando < TFloat32 > maxB, Operando < TFloat32 > minFreezedOutput, Operando < TFloat32 > maxFreezedOutput, Classe<W> Toutput, Opzioni... opzioni)
Metodo factory per creare una classe che racchiude una nuova operazione QuantizedMatMulWithBiasAndReluAndRequantize.
static QuantizedMatMulWithBiasAndReluAndRequantize.Options
inputQuantMode (stringa inputQuantMode)
Uscita < TFloat32 >
massimizzare ()
Il valore float rappresentato dal valore di uscita quantizzato più alto.
Uscita < TFloat32 >
minOut ()
Il valore float rappresentato dal valore di uscita quantizzato più basso.
Uscita <W>
fuori ()
static QuantizedMatMulWithBiasAndReluAndRequantize.Options
trasposizioneA (trasposizione booleana)
static QuantizedMatMulWithBiasAndReluAndRequantize.Options
transposeB (trasposizione booleana B)

Metodi ereditati

Costanti

Stringa finale statica pubblica OP_NAME

Il nome di questa operazione, come noto al motore principale di TensorFlow

Valore costante: "QuantizedMatMulWithBiasAndReluAndRequantize"

Metodi pubblici

public static QuantizedMatMulWithBiasAndReluAndRequantize <W> create ( Scope scope, Operando <? estende TType > a, Operando <? estende TType > b, Operando <? estende TType > bias, Operando < TFloat32 > minA, Operando < TFloat32 > maxA, Operando < TFloat32 > minB, Operando < TFloat32 > maxB, Operando < TFloat32 > minFreezedOutput, Operando < TFloat32 > maxFreezedOutput, Classe<W> Toutput, Opzioni... opzioni)

Metodo factory per creare una classe che racchiude una nuova operazione QuantizedMatMulWithBiasAndReluAndRequantize.

Parametri
scopo ambito attuale
UN Una matrice da moltiplicare. Deve essere un tensore bidimensionale di tipo "quint8".
B Una matrice da moltiplicare e deve essere un tensore bidimensionale di tipo "qint8".
pregiudizio Un tensore di polarizzazione 1D con dimensione corrispondente alla dimensione interna di "b" (dopo essere stato trasposto se "transposed_b" è diverso da zero).
minA Il valore float rappresentato dal valore "a" quantizzato più basso.
maxA Il valore float rappresentato dal valore "a" quantizzato più alto.
minB Il valore float rappresentato dal valore "b" quantizzato più basso.
maxB Il valore float rappresentato dal valore "b" quantizzato più alto.
minFreezedOutput Il valore float che corrisponde al valore di output quantizzato più alto dopo la riquantizzazione.
opzioni trasporta valori di attributi opzionali
ritorna
  • una nuova istanza di QuantizedMatMulWithBiasAndReluAndRequantize

pubblico statico QuantizedMatMulWithBiasAndReluAndRequantize.Options inputQuantMode (String inputQuantMode)

Parametri
inputQuantMode Modalità di quantizzazione dei dati in ingresso. O MIN_FIRST (predefinito) o SCALED.

Uscita pubblica < TFloat32 > maxOut ()

Il valore float rappresentato dal valore di uscita quantizzato più alto.

Uscita pubblica < TFloat32 > minOut ()

Il valore float rappresentato dal valore di uscita quantizzato più basso.

Uscita pubblica <W> out ()

public static QuantizedMatMulWithBiasAndReluAndRequantize.Options transposeA (transposeA booleano)

Parametri
trasporreA Se vero, "a" viene trasposto prima della moltiplicazione.

public static QuantizedMatMulWithBiasAndReluAndRequantize.Options transposeB (transposeB booleano)

Parametri
trasporreB Se vero, "b" viene trasposto prima della moltiplicazione.