QuantizedMatMulWithBiasAndReluAndRequantize

classe finale publique QuantizedMatMulWithBiasAndReluAndRequantize

Effectuez une multiplication matricielle quantifiée de « a » par la matrice « b » avec ajout de biais et fusion relu et requantification.

Les entrées doivent être des matrices bidimensionnelles et un vecteur de biais 1D. Et la dimension intérieure de « a » (après avoir été transposée si « transpose_a » est non nul) doit correspondre à la dimension extérieure de « b » (après avoir été transposée si « transposed_b » est non nul). Ensuite, effectuez une opération d'ajout de diffusion avec des valeurs de biais sur le résultat de la multiplication matricielle. La taille du biais doit correspondre à la dimension intérieure de « b ». Ensuite, activez relu pour obtenir un résultat non négatif. Ensuite, effectuez l'opération de requantification pour obtenir le résultat final uint8.

Classes imbriquées

classe QuantizedMatMulWithBiasAndReluAndRequantize.Options Attributs facultatifs pour QuantizedMatMulWithBiasAndReluAndRequantize

Méthodes publiques

statique <W, T, U, V> QuantizedMatMulWithBiasAndReluAndRequantize <W>
créer ( Portée portée , Opérande <T> a, Opérande <U> b, Opérande <V> biais, Opérande <Float> minA, Opérande <Float> maxA, Opérande <Float> minB, Opérande <Float> maxB, Opérande <Float> > minFreezedOutput, Opérande <Float> maxFreezedOutput, Class<W> Toutput, Options... options)
Méthode d'usine pour créer une classe encapsulant une nouvelle opération QuantizedMatMulWithBiasAndReluAndRequantize.
statique QuantizedMatMulWithBiasAndReluAndRequantize.Options
inputQuantMode (chaîne inputQuantMode)
Sortie <Flottant>
sortie max ()
La valeur flottante que représente la valeur de sortie quantifiée la plus élevée.
Sortie <Flottant>
minSortie ()
La valeur flottante que représente la valeur de sortie quantifiée la plus basse.
Sortie <W>
dehors ()
statique QuantizedMatMulWithBiasAndReluAndRequantize.Options
transposeA (transposeA booléenne)
statique QuantizedMatMulWithBiasAndReluAndRequantize.Options
transposeB (transposeB booléenne)

Méthodes héritées

Méthodes publiques

public static QuantizedMatMulWithBiasAndReluAndRequantize <W> créer ( Portée de la portée , Opérande <T> a, Opérande <U> b, Opérande <V> biais, Opérande <Float> minA, Opérande <Float> maxA, Opérande <Float> minB, Opérande <Float > maxB, Opérande <Float> minFreezedOutput, Opérande <Float> maxFreezedOutput, Class<W> Toutput, Options... options)

Méthode d'usine pour créer une classe encapsulant une nouvelle opération QuantizedMatMulWithBiasAndReluAndRequantize.

Paramètres
portée portée actuelle
un Une matrice à multiplier. Doit être un tenseur bidimensionnel de type « quint8 ».
b Une matrice à multiplier et doit être un tenseur bidimensionnel de type « qint8 ».
biais Un tenseur de biais 1D dont la taille correspond à la dimension intérieure de « b » (après avoir été transposé si « transposed_b » est non nul).
minA La valeur flottante que représente la valeur « a » quantifiée la plus basse.
maxA La valeur flottante que représente la valeur « a » quantifiée la plus élevée.
minB La valeur flottante que représente la valeur « b » quantifiée la plus basse.
maxB La valeur flottante que représente la valeur « b » quantifiée la plus élevée.
minFreezedOutput La valeur flottante qui correspond à la valeur de sortie quantifiée la plus élevée après la requantification.
choix porte des valeurs d'attributs facultatifs
Retour
  • une nouvelle instance de QuantizedMatMulWithBiasAndReluAndRequantize

public statique QuantizedMatMulWithBiasAndReluAndRequantize.Options inputQuantMode (String inputQuantMode)

Paramètres
inputQuantMode Mode de quantification des données d’entrée. Soit MIN_FIRST (par défaut) soit SCALED.

sortie publique <Float> maxOut ()

La valeur flottante que représente la valeur de sortie quantifiée la plus élevée.

sortie publique <Float> minOut ()

La valeur flottante que représente la valeur de sortie quantifiée la plus basse.

Sortie publique <W> out ()

public static QuantizedMatMulWithBiasAndReluAndRequantize.Options transposeA (Boolean transposeA)

Paramètres
transposerA Si c'est vrai, `a` est transposé avant la multiplication.

public static QuantizedMatMulWithBiasAndReluAndRequantize.Options transposeB (booléen transposeB)

Paramètres
transposerB Si c'est vrai, `b` est transposé avant la multiplication.