QuantizedMatMulWithBiasAndReluAndRequantize

publiczna klasa końcowa QuantizedMatMulWithBiasAndReluAndRequantize

Wykonaj skwantowane mnożenie macierzy „a” przez macierz „b” z dodawaniem odchylenia, relu i ponowną kwantyzacją fuzji.

Dane wejściowe muszą być macierzami dwuwymiarowymi i wektorem odchylenia 1D. A wewnętrzny wymiar `a` (po transpozycji, jeśli `transpose_a` jest niezerowe) musi odpowiadać zewnętrznemu wymiarowi `b` (po transpozycji, jeśli `transpose_b` jest niezerowe). Następnie wykonaj operację dodawania transmisji z wartościami odchylenia na wyniku mnożenia macierzy. Rozmiar odchylenia musi odpowiadać wewnętrznemu wymiarowi „b”. Następnie wykonaj aktywację relu, aby uzyskać wynik nieujemny. Następnie wykonaj operację ponownej kwantyzacji, aby uzyskać końcowy wynik uint8.

Klasy zagnieżdżone

klasa QuantizedMatMulWithBiasAndReluAndRequantize.Options Opcjonalne atrybuty dla QuantizedMatMulWithBiasAndReluAndRequantize

Stałe

Strunowy OP_NAME Nazwa tej operacji znana silnikowi rdzenia TensorFlow

Metody publiczne

statyczny <W rozszerza TType > QuantizedMatMulWithBiasAndReluAndRequantize <W>
utwórz (Zakres zasięgu , Operand <? rozszerza TType > a, Operand <? rozszerza TType > b, Operand <? rozszerza TType > bias, Operand < TFloat32 > minA, Operand < TFloat32 > maxA, Operand < TFloat32 > minB, Operand < TFloat32 > maxB, Operand < TFloat32 > minFreezedOutput, Operand < TFloat32 > maxFreezedOutput, Class<W> Toutput, Opcje... opcje)
Metoda fabryczna służąca do tworzenia klasy opakowującej nową operację QuantizedMatMulWithBiasAndReluAndRequantize.
statyczny QuantizedMatMulWithBiasAndReluAndRequantize.Options
inputQuantMode (ciąg znaków inputQuantMode)
Dane wyjściowe <TFloat32>
maxOut ()
Wartość zmiennoprzecinkowa, którą reprezentuje najwyższa skwantowana wartość wyjściowa.
Dane wyjściowe <TFloat32>
MinOut ()
Wartość zmiennoprzecinkowa reprezentowana przez najniższą skwantyzowaną wartość wyjściową.
Wyjście <W>
statyczny QuantizedMatMulWithBiasAndReluAndRequantize.Options
transpozycjaA (logiczna transpozycjaA)
statyczny QuantizedMatMulWithBiasAndReluAndRequantize.Options
transpozycja B (logiczna transpozycja B)

Metody dziedziczone

Stałe

publiczny statyczny końcowy ciąg znaków OP_NAME

Nazwa tej operacji znana silnikowi rdzenia TensorFlow

Stała wartość: „QuantizedMatMulWithBiasAndReluAndRequantize”

Metody publiczne

public static QuantizedMatMulWithBiasAndReluAndRequantize <W> create ( Zakres zakresu, Operand <? rozszerza TType > a, Operand <? rozszerza TType > b, Operand <? rozszerza TType > bias, Operand < TFloat32 > minA, Operand < TFloat32 > maxA, Operand < TFloat32 > minB, Argument < TFloat32 > maxB, Argument < TFloat32 > minFreezedOutput, Argument < TFloat32 > maxFreezedOutput, Class<W> Toutput, Opcje... opcje)

Metoda fabryczna służąca do tworzenia klasy opakowującej nową operację QuantizedMatMulWithBiasAndReluAndRequantize.

Parametry
zakres aktualny zakres
A Macierz do pomnożenia. Musi to być dwuwymiarowy tensor typu „quint8”.
B Macierz do pomnożenia, która musi być dwuwymiarowym tensorem typu `qint8`.
stronniczość Tensor odchylenia 1D z dopasowaniem rozmiaru do wewnętrznego wymiaru „b” (po transpozycji, jeśli „transponowany_b” jest niezerowy).
minA Wartość zmiennoprzecinkowa, którą reprezentuje najniższa skwantowana wartość „a”.
maksA Wartość zmiennoprzecinkowa, którą reprezentuje najwyższa skwantowana wartość „a”.
minB Wartość zmiennoprzecinkowa reprezentowana przez najniższą skwantowaną wartość „b”.
maks. B Wartość zmiennoprzecinkowa, którą reprezentuje najwyższa skwantowana wartość „b”.
minZamrożone wyjście Wartość zmiennoprzecinkowa stanowiąca najwyższą skwantyzowaną wartość wyjściową po ponownej kwantyzacji.
opcje przenosi opcjonalne wartości atrybutów
Zwroty
  • nowa instancja QuantizedMatMulWithBiasAndReluAndRequantize

public static QuantizedMatMulWithBiasAndReluAndRequantize.Options inputQuantMode (String inputQuantMode)

Parametry
tryb wejściowyQuant Tryb kwantyzacji danych wejściowych. Albo MIN_FIRST (domyślnie) albo SCALED.

publiczne wyjście < TFloat32 > maxOut ()

Wartość zmiennoprzecinkowa, którą reprezentuje najwyższa skwantowana wartość wyjściowa.

publiczne wyjście < TFloat32 > minOut ()

Wartość zmiennoprzecinkowa reprezentowana przez najniższą skwantyzowaną wartość wyjściową.

publiczne wyjście <W> out ()

public static QuantizedMatMulWithBiasAndReluAndRequantize.Options transposeA (Boolean transposeA)

Parametry
transponowaćA Jeśli to prawda, „a” jest transponowane przed mnożeniem.

public static QuantizedMatMulWithBiasAndReluAndRequantize.Options transposeB (Boolean transposeB)

Parametry
transponowaćB Jeśli prawda, „b” jest transponowane przed mnożeniem.