QuantizedMatMulWithBias

publiczna klasa końcowa QuantizedMatMulWithBias

Wykonuje skwantowane mnożenie macierzy „a” przez macierz „b” z dodatkiem obciążenia.

Dane wejściowe muszą być macierzami dwuwymiarowymi i wektorem odchylenia 1D. A wewnętrzny wymiar `a` (po transpozycji, jeśli `transpose_a` jest niezerowe) musi odpowiadać zewnętrznemu wymiarowi `b` (po transpozycji, jeśli `transpose_b` jest niezerowe). Następnie wykonaj operację dodawania transmisji z wartościami odchylenia na wyniku mnożenia macierzy. Rozmiar odchylenia musi odpowiadać wewnętrznemu wymiarowi „b”.

Klasy zagnieżdżone

klasa QuantizedMatMulWithBias.Options Opcjonalne atrybuty dla QuantizedMatMulWithBias

Metody publiczne

statyczny <W, T, U, V> QuantizedMatMulWithBias <W>
utwórz ( Zakres zasięgu, Operand <T> a, Operand <U> b, Operand <V> odchylenie, Operand <Float> minA, Operand <Float> maxA, Operand <Float> minB, Operand <Float> maxB, Class<W > Wyjście, Opcje... opcje)
Metoda fabryczna służąca do tworzenia klasy opakowującej nową operację QuantizedMatMulWithBias.
statyczne QuantizedMatMulWithBias.Options
inputQuantMode (ciąg znaków inputQuantMode)
Wyjście <Pływak>
maxOut ()
Wartość zmiennoprzecinkowa, którą reprezentuje najwyższa skwantowana wartość wyjściowa.
Wyjście <Pływak>
MinOut ()
Wartość zmiennoprzecinkowa reprezentowana przez najniższą skwantyzowaną wartość wyjściową.
Wyjście <W>
statyczne QuantizedMatMulWithBias.Options
transpozycjaA (logiczna transpozycjaA)
statyczne QuantizedMatMulWithBias.Options
transpozycja B (logiczna transpozycja B)

Metody dziedziczone

Metody publiczne

public static QuantizedMatMulWithBias <W> create ( Zakres zasięgu , Operand <T> a, Operand <U> b, Operand <V> bias, Operand <Float> minA, Operand <Float> maxA, Operand <Float> minB, Operand <Float > maxB, Class<W> Toutput, Opcje... opcje)

Metoda fabryczna służąca do tworzenia klasy opakowującej nową operację QuantizedMatMulWithBias.

Parametry
zakres aktualny zakres
A Macierz do pomnożenia. Musi to być dwuwymiarowy tensor typu „quint8”.
B Macierz do pomnożenia, która musi być dwuwymiarowym tensorem typu `qint8`.
stronniczość Tensor odchylenia 1D o rozmiarze odpowiadającym wewnętrznemu wymiarowi „b” (po transpozycji, jeśli „transponowany_b” jest różny od zera).
minA Wartość zmiennoprzecinkowa, którą reprezentuje najniższa skwantowana wartość „a”.
maksA Wartość zmiennoprzecinkowa, którą reprezentuje najwyższa skwantowana wartość „a”.
minB Wartość zmiennoprzecinkowa reprezentowana przez najniższą skwantowaną wartość „b”.
maks. B Wartość zmiennoprzecinkowa, którą reprezentuje najwyższa skwantowana wartość „b”.
opcje przenosi opcjonalne wartości atrybutów
Zwroty
  • nowa instancja QuantizedMatMulWithBias

public static QuantizedMatMulWithBias.Options inputQuantMode (String inputQuantMode)

Parametry
tryb wejściowyQuant Tryb kwantyzacji danych wejściowych. Albo MIN_FIRST (domyślnie) albo SCALED.

publiczne wyjście <Float> maxOut ()

Wartość zmiennoprzecinkowa, którą reprezentuje najwyższa skwantowana wartość wyjściowa.

publiczne wyjście <Float> minOut ()

Wartość zmiennoprzecinkowa reprezentowana przez najniższą skwantyzowaną wartość wyjściową.

publiczne wyjście <W> out ()

public static QuantizedMatMulWithBias.Options transposeA (Boolean transposeA)

Parametry
transponowaćA Jeśli to prawda, „a” jest transponowane przed mnożeniem.

public static QuantizedMatMulWithBias.Options transposeB (Boolean transposeB)

Parametry
transponowaćB Jeśli prawda, „b” jest transponowane przed mnożeniem.