Eseguire una moltiplicazione matrice quantizzata di "a" per la matrice "b" con aggiunta di polarizzazione e fusione di relu.
Gli input devono essere matrici bidimensionali e vettore di polarizzazione 1D. E la dimensione interna di "a" (dopo essere stata trasposta se "transpose_a" è diverso da zero) deve corrispondere alla dimensione esterna di "b" (dopo essere stata trasposta se "transposed_b" è diverso da zero). Quindi eseguire l'operazione di aggiunta della trasmissione con valori di polarizzazione sul risultato della moltiplicazione della matrice. La dimensione del bias deve corrispondere alla dimensione interna di "b". Quindi eseguire l'attivazione relu per ottenere un risultato non negativo.
Classi annidate
classe | QuantizedMatMulWithBiasAndRelu.Options | Attributi facoltativi per QuantizedMatMulWithBiasAndRelu |
Metodi pubblici
statico <V, T, U> QuantizedMatMulWithBiasAndRelu <V> | create ( Ambito dell'ambito, Operando <T> a, Operando <U> b, Operando <Float> bias, Operando <Float> minA, Operando <Float> maxA, Operando <Float> minB, Operando <Float> maxB, Classe <V > Uscita, Opzioni ... opzioni) Metodo Factory per creare una classe che racchiude una nuova operazione QuantizedMatMulWithBiasAndRelu. |
statico QuantizedMatMulWithBiasAndRelu.Options | inputQuantMode (String inputQuantMode) |
Uscita <Float> | maxOut () Il valore float rappresentato dal valore di uscita quantizzato più alto. |
Uscita <Float> | minOut () Il valore float rappresentato dal valore di uscita quantizzato più basso. |
Uscita <V> | fuori () |
statico QuantizedMatMulWithBiasAndRelu.Options | transposeA (Boolean transposeA) |
statico QuantizedMatMulWithBiasAndRelu.Options | transposeB (Boolean transposeB) |
Metodi ereditati
Metodi pubblici
public static QuantizedMatMulWithBiasAndRelu <V> create ( ambito ambito, operando <T> a, operando <U> b, operando <Float> bias, operando <Float> minA, operando <Float> maxA, operando <Float> minB, operando <Float > maxB, Classe <V> Toutput, Opzioni ... opzioni)
Metodo Factory per creare una classe che racchiude una nuova operazione QuantizedMatMulWithBiasAndRelu.
Parametri
scopo | ambito attuale |
---|---|
un | Una matrice da moltiplicare. Deve essere un tensore bidimensionale di tipo "quint8". |
b | Una matrice da moltiplicare e deve essere un tensore bidimensionale di tipo "qint8". |
pregiudizio | Un tensore di polarizzazione 1D con dimensione corrispondente alla dimensione interna di "b" (dopo essere stato trasposto se "trasposto_b" è diverso da zero). |
minA | Il valore float rappresentato dal valore "a" quantizzato più basso. |
maxA | Il valore float rappresentato dal valore "a" quantizzato più alto. |
minB | Il valore float rappresentato dal valore "b" quantizzato più basso. |
maxB | Il valore float rappresentato dal valore "b" quantizzato più alto. |
opzioni | trasporta valori di attributi opzionali |
ritorna
- una nuova istanza di QuantizedMatMulWithBiasAndRelu
public static QuantizedMatMulWithBiasAndRelu.Options inputQuantMode (String inputQuantMode)
Parametri
inputQuantMode | Modalità di quantizzazione dei dati di input. O MIN_FIRST (predefinito) o SCALED. |
---|
output pubblico <Float> maxOut ()
Il valore float rappresentato dal valore di uscita quantizzato più alto.
output pubblico <Float> minOut ()
Il valore float rappresentato dal valore di uscita quantizzato più basso.
public static QuantizedMatMulWithBiasAndRelu.Options transposeA (Boolean transposeA)
Parametri
trasporreA | Se vero, "a" viene trasposto prima della moltiplicazione. |
---|
public static QuantizedMatMulWithBiasAndRelu.Options transposeB (Boolean transposeB)
Parametri
trasporre B. | Se vero, "b" viene trasposto prima della moltiplicazione. |
---|