Effectuez une multiplication matricielle quantifiée de « a » par la matrice « b » avec ajout de biais et fusion relu et requantification.
Les entrées doivent être des matrices bidimensionnelles et un vecteur de biais 1D. Et la dimension intérieure de « a » (après avoir été transposée si « transpose_a » est non nul) doit correspondre à la dimension extérieure de « b » (après avoir été transposée si « transposed_b » est non nul). Ensuite, effectuez une opération d'ajout de diffusion avec des valeurs de biais sur le résultat de la multiplication matricielle. La taille du biais doit correspondre à la dimension intérieure de « b ». Ensuite, activez relu pour obtenir un résultat non négatif. Ensuite, effectuez l'opération de requantification pour obtenir le résultat final uint8.
Classes imbriquées
classe | QuantizedMatMulWithBiasAndReluAndRequantize.Options | Attributs facultatifs pour QuantizedMatMulWithBiasAndReluAndRequantize |
Constantes
Chaîne | OP_NAME | Le nom de cette opération, tel que connu par le moteur principal TensorFlow |
Méthodes publiques
statique <W extends TType > QuantizedMatMulWithBiasAndReluAndRequantize <W> | créer ( Portée de portée , Opérande <? étend TType > a, Opérande <? étend TType > b, Opérande <? étend TType > biais, Opérande < TFloat32 > minA, Opérande < TFloat32 > maxA, Opérande < TFloat32 > minB, Opérande < TFloat32 > maxB, Opérande < TFloat32 > minFreezedOutput, Opérande < TFloat32 > maxFreezedOutput, Class<W> Toutput, Options... options) Méthode d'usine pour créer une classe encapsulant une nouvelle opération QuantizedMatMulWithBiasAndReluAndRequantize. |
statique QuantizedMatMulWithBiasAndReluAndRequantize.Options | inputQuantMode (chaîne inputQuantMode) |
Sortie < TFloat32 > | sortie max () La valeur flottante que représente la valeur de sortie quantifiée la plus élevée. |
Sortie < TFloat32 > | minSortie () La valeur flottante que représente la valeur de sortie quantifiée la plus basse. |
Sortie <W> | dehors () |
statique QuantizedMatMulWithBiasAndReluAndRequantize.Options | transposeA (transposeA booléenne) |
statique QuantizedMatMulWithBiasAndReluAndRequantize.Options | transposeB (transposeB booléenne) |
Méthodes héritées
Constantes
chaîne finale statique publique OP_NAME
Le nom de cette opération, tel que connu par le moteur principal TensorFlow
Méthodes publiques
public static QuantizedMatMulWithBiasAndReluAndRequantize <W> créer ( Portée de portée, Opérande <? étend TType > a, Opérande <? étend TType > b, Opérande <? étend TType > biais, Opérande < TFloat32 > minA, Opérande < TFloat32 > maxA, Opérande < TFloat32 > minB, Opérande < TFloat32 > maxB, Opérande < TFloat32 > minFreezedOutput, Opérande < TFloat32 > maxFreezedOutput, Class<W> Toutput, Options... options)
Méthode d'usine pour créer une classe encapsulant une nouvelle opération QuantizedMatMulWithBiasAndReluAndRequantize.
Paramètres
portée | portée actuelle |
---|---|
un | Une matrice à multiplier. Doit être un tenseur bidimensionnel de type « quint8 ». |
b | Une matrice à multiplier et doit être un tenseur bidimensionnel de type « qint8 ». |
biais | Un tenseur de biais 1D dont la taille correspond à la dimension intérieure de « b » (après avoir été transposé si « transposed_b » est non nul). |
minA | La valeur flottante que représente la valeur « a » quantifiée la plus basse. |
maxA | La valeur flottante que représente la valeur « a » quantifiée la plus élevée. |
minB | La valeur flottante que représente la valeur « b » quantifiée la plus basse. |
maxB | La valeur flottante que représente la valeur « b » quantifiée la plus élevée. |
minFreezedOutput | La valeur flottante qui correspond à la valeur de sortie quantifiée la plus élevée après la requantification. |
choix | porte des valeurs d'attributs facultatifs |
Retour
- une nouvelle instance de QuantizedMatMulWithBiasAndReluAndRequantize
public statique QuantizedMatMulWithBiasAndReluAndRequantize.Options inputQuantMode (String inputQuantMode)
Paramètres
inputQuantMode | Mode de quantification des données d’entrée. Soit MIN_FIRST (par défaut) soit SCALED. |
---|
Sortie publique < TFloat32 > maxOut ()
La valeur flottante que représente la valeur de sortie quantifiée la plus élevée.
Sortie publique < TFloat32 > minOut ()
La valeur flottante que représente la valeur de sortie quantifiée la plus basse.
public static QuantizedMatMulWithBiasAndReluAndRequantize.Options transposeA (Boolean transposeA)
Paramètres
transposerA | Si c'est vrai, `a` est transposé avant la multiplication. |
---|
public static QuantizedMatMulWithBiasAndReluAndRequantize.Options transposeB (booléen transposeB)
Paramètres
transposerB | Si c'est vrai, `b` est transposé avant la multiplication. |
---|