QuantizedMatMulWithBiasAndRelu

publiczna klasa końcowa QuantizedMatMulWithBiasAndRelu

Wykonaj skwantowane mnożenie macierzy „a” przez macierz „b” z dodatkiem obciążenia i fuzją relu.

Dane wejściowe muszą być macierzami dwuwymiarowymi i wektorem odchylenia 1D. A wewnętrzny wymiar `a` (po transpozycji, jeśli `transpose_a` jest niezerowe) musi odpowiadać zewnętrznemu wymiarowi `b` (po transpozycji, jeśli `transpose_b` jest niezerowe). Następnie wykonaj operację dodawania transmisji z wartościami odchylenia na wyniku mnożenia macierzy. Rozmiar odchylenia musi odpowiadać wewnętrznemu wymiarowi „b”. Następnie wykonaj aktywację relu, aby uzyskać wynik nieujemny.

Klasy zagnieżdżone

klasa QuantizedMatMulWithBiasAndRelu.Options Opcjonalne atrybuty dla QuantizedMatMulWithBiasAndRelu

Metody publiczne

statyczny <V, T, U> QuantizedMatMulWithBiasAndRelu <V>
utwórz ( Zakres zasięgu, Operand <T> a, Operand <U> b, Operand <Float> odchylenie, Operand <Float> minA, Operand <Float> maxA, Operand <Float> minB, Operand <Float> maxB, Class<V > Wyjście, Opcje... opcje)
Metoda fabryczna służąca do tworzenia klasy opakowującej nową operację QuantizedMatMulWithBiasAndRelu.
statyczne QuantizedMatMulWithBiasAndRelu.Options
inputQuantMode (ciąg znaków inputQuantMode)
Wyjście <Pływak>
maxOut ()
Wartość zmiennoprzecinkowa, którą reprezentuje najwyższa skwantowana wartość wyjściowa.
Wyjście <Pływak>
MinOut ()
Wartość zmiennoprzecinkowa reprezentowana przez najniższą skwantyzowaną wartość wyjściową.
Wyjście <V>
statyczne QuantizedMatMulWithBiasAndRelu.Options
transpozycjaA (logiczna transpozycjaA)
statyczne QuantizedMatMulWithBiasAndRelu.Options
transpozycja B (logiczna transpozycja B)

Metody dziedziczone

Metody publiczne

public static QuantizedMatMulWithBiasAndRelu <V> create ( Zakres zakresu, Operand <T> a, Operand <U> b, Operand <Float> odchylenie, Operand <Float> minA, Operand <Float> maxA, Operand <Float> minB, Operand <Float > maxB, Klasa<V> Towyjście, Opcje... opcje)

Metoda fabryczna służąca do tworzenia klasy opakowującej nową operację QuantizedMatMulWithBiasAndRelu.

Parametry
zakres aktualny zakres
A Macierz do pomnożenia. Musi to być dwuwymiarowy tensor typu „quint8”.
B Macierz do pomnożenia, która musi być dwuwymiarowym tensorem typu `qint8`.
stronniczość Tensor odchylenia 1D z dopasowaniem rozmiaru do wewnętrznego wymiaru „b” (po transpozycji, jeśli „transponowany_b” jest niezerowy).
minA Wartość zmiennoprzecinkowa, którą reprezentuje najniższa skwantowana wartość „a”.
maksA Wartość zmiennoprzecinkowa, którą reprezentuje najwyższa skwantowana wartość „a”.
minB Wartość zmiennoprzecinkowa reprezentowana przez najniższą skwantowaną wartość „b”.
maks. B Wartość zmiennoprzecinkowa, którą reprezentuje najwyższa skwantowana wartość „b”.
opcje przenosi opcjonalne wartości atrybutów
Zwroty
  • nowa instancja QuantizedMatMulWithBiasAndRelu

public static QuantizedMatMulWithBiasAndRelu.Options inputQuantMode (String inputQuantMode)

Parametry
tryb wejściowyQuant Tryb kwantyzacji danych wejściowych. Albo MIN_FIRST (domyślnie) albo SCALED.

publiczne wyjście <Float> maxOut ()

Wartość zmiennoprzecinkowa, którą reprezentuje najwyższa skwantowana wartość wyjściowa.

publiczne wyjście <Float> minOut ()

Wartość zmiennoprzecinkowa reprezentowana przez najniższą skwantyzowaną wartość wyjściową.

publiczne wyjście <V> out ()

public static QuantizedMatMulWithBiasAndRelu.Options transposeA (Boolean transposeA)

Parametry
transponowaćA Jeśli to prawda, „a” jest transponowane przed mnożeniem.

public static QuantizedMatMulWithBiasAndRelu.Options transposeB (Boolean transposeB)

Parametry
transponowaćB Jeśli prawda, „b” jest transponowane przed mnożeniem.