QuantizedMatMulWithBiasAndReluAndRequantize

public final class QuantizedMatMulWithBiasAndReluAndRequantize

Eseguire una moltiplicazione della matrice quantizzata di "a" per la matrice "b" con aggiunta di polarizzazione e fusione di relu e riquantizzazione.

Gli input devono essere matrici bidimensionali e vettore di polarizzazione 1D. E la dimensione interna di "a" (dopo essere stata trasposta se "transpose_a" è diverso da zero) deve corrispondere alla dimensione esterna di "b" (dopo essere stata trasposta se "transposed_b" è diverso da zero). Quindi eseguire l'operazione di aggiunta della trasmissione con valori di polarizzazione sul risultato della moltiplicazione della matrice. La dimensione del bias deve corrispondere alla dimensione interna di "b". Quindi eseguire l'attivazione relu per ottenere un risultato non negativo. Quindi riquantizza l'operazione per ottenere il risultato finale di uint8.

Classi annidate

classe QuantizedMatMulWithBiasAndReluAndRequantize.Options Attributi facoltativi per QuantizedMatMulWithBiasAndReluAndRequantize

Metodi pubblici

statico <W, T, U, V> QuantizedMatMulWithBiasAndReluAndRequantize <W>
create ( ambito ambito, operando <T> a, operando <U> b, operando <V> bias, operando <Float> minA, operando <Float> maxA, operando <Float> minB, operando <Float> maxB, operando <Float > minFreezedOutput, Operando <Float> maxFreezedOutput, Classe <W> Toutput, Opzioni ... opzioni)
Metodo Factory per creare una classe che racchiude una nuova operazione QuantizedMatMulWithBiasAndReluAndRequantize.
statico QuantizedMatMulWithBiasAndReluAndRequantize.Options
inputQuantMode (String inputQuantMode)
Uscita <Float>
maxOut ()
Il valore float rappresentato dal valore di uscita quantizzato più alto.
Uscita <Float>
minOut ()
Il valore float rappresentato dal valore di uscita quantizzato più basso.
Uscita <W>
fuori ()
statico QuantizedMatMulWithBiasAndReluAndRequantize.Options
transposeA (Boolean transposeA)
statico QuantizedMatMulWithBiasAndReluAndRequantize.Options
transposeB (Boolean transposeB)

Metodi ereditati

Metodi pubblici

public static QuantizedMatMulWithBiasAndReluAndRequantize <W> create ( Scope scope, Operand <T> a, Operand <U> b, Operand <V> bias, Operand <Float> minA, Operand <Float> maxA, Operand <Float> minB, Operand <Float > maxB, Operando <Float> minFreezedOutput, Operando <Float> maxFreezedOutput, Classe <W> Toutput, Opzioni ... opzioni)

Metodo Factory per creare una classe che racchiude una nuova operazione QuantizedMatMulWithBiasAndReluAndRequantize.

Parametri
scopo ambito attuale
un Una matrice da moltiplicare. Deve essere un tensore bidimensionale di tipo "quint8".
b Una matrice da moltiplicare e deve essere un tensore bidimensionale di tipo "qint8".
pregiudizio Un tensore di polarizzazione 1D con dimensione corrispondente alla dimensione interna di "b" (dopo essere stato trasposto se "trasposto_b" è diverso da zero).
minA Il valore float rappresentato dal valore "a" quantizzato più basso.
maxA Il valore float rappresentato dal valore "a" quantizzato più alto.
minB Il valore float rappresentato dal valore "b" quantizzato più basso.
maxB Il valore float rappresentato dal valore "b" quantizzato più alto.
minFreezedOutput Il valore float che il valore di output quantizzato più alto dopo la riquantizzazione.
opzioni trasporta valori di attributi opzionali
ritorna
  • una nuova istanza di QuantizedMatMulWithBiasAndReluAndRequantize

public static QuantizedMatMulWithBiasAndReluAndRequantize.Options inputQuantMode (String inputQuantMode)

Parametri
inputQuantMode Modalità di quantizzazione dei dati di input. O MIN_FIRST (predefinito) o SCALED.

output pubblico <Float> maxOut ()

Il valore float rappresentato dal valore di uscita quantizzato più alto.

output pubblico <Float> minOut ()

Il valore float rappresentato dal valore di uscita quantizzato più basso.

uscita pubblica <W> out ()

public static QuantizedMatMulWithBiasAndReluAndRequantize.Options transposeA (Boolean transposeA)

Parametri
trasporreA Se vero, "a" viene trasposto prima della moltiplicazione.

public static QuantizedMatMulWithBiasAndReluAndRequantize.Options transposeB (Boolean transposeB)

Parametri
trasporre B. Se vero, "b" viene trasposto prima della moltiplicazione.