Wykonaj skwantowane mnożenie macierzy „a” przez macierz „b” z dodawaniem odchylenia, relu i ponowną kwantyzacją fuzji.
Dane wejściowe muszą być macierzami dwuwymiarowymi i wektorem odchylenia 1D. A wewnętrzny wymiar `a` (po transpozycji, jeśli `transpose_a` jest niezerowe) musi odpowiadać zewnętrznemu wymiarowi `b` (po transpozycji, jeśli `transpose_b` jest niezerowe). Następnie wykonaj operację dodawania transmisji z wartościami odchylenia na wyniku mnożenia macierzy. Rozmiar odchylenia musi odpowiadać wewnętrznemu wymiarowi „b”. Następnie wykonaj aktywację relu, aby uzyskać wynik nieujemny. Następnie wykonaj operację ponownej kwantyzacji, aby uzyskać końcowy wynik uint8.
Klasy zagnieżdżone
klasa | QuantizedMatMulWithBiasAndReluAndRequantize.Options | Opcjonalne atrybuty dla QuantizedMatMulWithBiasAndReluAndRequantize |
Stałe
Strunowy | OP_NAME | Nazwa tej operacji znana silnikowi rdzenia TensorFlow |
Metody publiczne
statyczny <W rozszerza TType > QuantizedMatMulWithBiasAndReluAndRequantize <W> | utwórz (Zakres zasięgu , Operand <? rozszerza TType > a, Operand <? rozszerza TType > b, Operand <? rozszerza TType > bias, Operand < TFloat32 > minA, Operand < TFloat32 > maxA, Operand < TFloat32 > minB, Operand < TFloat32 > maxB, Operand < TFloat32 > minFreezedOutput, Operand < TFloat32 > maxFreezedOutput, Class<W> Toutput, Opcje... opcje) Metoda fabryczna służąca do tworzenia klasy opakowującej nową operację QuantizedMatMulWithBiasAndReluAndRequantize. |
statyczny QuantizedMatMulWithBiasAndReluAndRequantize.Options | inputQuantMode (ciąg znaków inputQuantMode) |
Dane wyjściowe <TFloat32> | maxOut () Wartość zmiennoprzecinkowa, którą reprezentuje najwyższa skwantowana wartość wyjściowa. |
Dane wyjściowe <TFloat32> | MinOut () Wartość zmiennoprzecinkowa reprezentowana przez najniższą skwantyzowaną wartość wyjściową. |
Wyjście <W> | na zewnątrz () |
statyczny QuantizedMatMulWithBiasAndReluAndRequantize.Options | transpozycjaA (logiczna transpozycjaA) |
statyczny QuantizedMatMulWithBiasAndReluAndRequantize.Options | transpozycja B (logiczna transpozycja B) |
Metody dziedziczone
Stałe
publiczny statyczny końcowy ciąg znaków OP_NAME
Nazwa tej operacji znana silnikowi rdzenia TensorFlow
Metody publiczne
public static QuantizedMatMulWithBiasAndReluAndRequantize <W> create ( Zakres zakresu, Operand <? rozszerza TType > a, Operand <? rozszerza TType > b, Operand <? rozszerza TType > bias, Operand < TFloat32 > minA, Operand < TFloat32 > maxA, Operand < TFloat32 > minB, Argument < TFloat32 > maxB, Argument < TFloat32 > minFreezedOutput, Argument < TFloat32 > maxFreezedOutput, Class<W> Toutput, Opcje... opcje)
Metoda fabryczna służąca do tworzenia klasy opakowującej nową operację QuantizedMatMulWithBiasAndReluAndRequantize.
Parametry
zakres | aktualny zakres |
---|---|
A | Macierz do pomnożenia. Musi to być dwuwymiarowy tensor typu „quint8”. |
B | Macierz do pomnożenia, która musi być dwuwymiarowym tensorem typu `qint8`. |
stronniczość | Tensor odchylenia 1D z dopasowaniem rozmiaru do wewnętrznego wymiaru „b” (po transpozycji, jeśli „transponowany_b” jest niezerowy). |
minA | Wartość zmiennoprzecinkowa, którą reprezentuje najniższa skwantowana wartość „a”. |
maksA | Wartość zmiennoprzecinkowa, którą reprezentuje najwyższa skwantowana wartość „a”. |
minB | Wartość zmiennoprzecinkowa reprezentowana przez najniższą skwantowaną wartość „b”. |
maks. B | Wartość zmiennoprzecinkowa, którą reprezentuje najwyższa skwantowana wartość „b”. |
minZamrożone wyjście | Wartość zmiennoprzecinkowa stanowiąca najwyższą skwantyzowaną wartość wyjściową po ponownej kwantyzacji. |
opcje | przenosi opcjonalne wartości atrybutów |
Zwroty
- nowa instancja QuantizedMatMulWithBiasAndReluAndRequantize
public static QuantizedMatMulWithBiasAndReluAndRequantize.Options inputQuantMode (String inputQuantMode)
Parametry
tryb wejściowyQuant | Tryb kwantyzacji danych wejściowych. Albo MIN_FIRST (domyślnie) albo SCALED. |
---|
publiczne wyjście < TFloat32 > maxOut ()
Wartość zmiennoprzecinkowa, którą reprezentuje najwyższa skwantowana wartość wyjściowa.
publiczne wyjście < TFloat32 > minOut ()
Wartość zmiennoprzecinkowa reprezentowana przez najniższą skwantyzowaną wartość wyjściową.
public static QuantizedMatMulWithBiasAndReluAndRequantize.Options transposeA (Boolean transposeA)
Parametry
transponowaćA | Jeśli to prawda, „a” jest transponowane przed mnożeniem. |
---|
public static QuantizedMatMulWithBiasAndReluAndRequantize.Options transposeB (Boolean transposeB)
Parametry
transponowaćB | Jeśli prawda, „b” jest transponowane przed mnożeniem. |
---|