QuantizedMatMulWithBias

clase final pública QuantizedMatMulWithBias

Realiza una multiplicación de matriz cuantificada de `a` por la matriz `b` con suma sesgada.

Las entradas deben ser matrices bidimensionales y un vector de polarización 1D. Y la dimensión interna de "a" (después de ser transpuesta si "transpose_a" no es cero) debe coincidir con la dimensión externa de "b" (después de ser transpuesta si "transpose_b" no es cero). Luego transmita la operación de suma con valores de sesgo en el resultado de la multiplicación de matrices. El tamaño del sesgo debe coincidir con la dimensión interior de "b".

Clases anidadas

clase QuantizedMatMulWithBias.Options Atributos opcionales para QuantizedMatMulWithBias

Constantes

Cadena OP_NOMBRE El nombre de esta operación, como lo conoce el motor central de TensorFlow.

Métodos públicos

estático <W extiende TType > QuantizedMatMulWithBias <W>
crear ( Alcance alcance, Operando <? extiende TType > a, Operando <? extiende TType > b, Operando <? extiende TType > sesgo, Operando < TFloat32 > minA, Operando < TFloat32 > maxA, Operando < TFloat32 > minB, Operando < TFloat32 > maxB, Clase<W> Salida, Opciones... opciones)
Método de fábrica para crear una clase que envuelve una nueva operación QuantizedMatMulWithBias.
estático QuantizedMatMulWithBias.Options
inputQuantMode (cadena de entradaQuantMode)
Salida <TFloat32>
máximo fuera ()
El valor flotante que representa el valor de salida cuantificado más alto.
Salida <TFloat32>
minOut ()
El valor flotante que representa el valor de salida cuantificado más bajo.
Salida <W>
afuera ()
estático QuantizedMatMulWithBias.Options
transposeA (transposeA booleana)
estático QuantizedMatMulWithBias.Options
transposiciónB (transposición booleanaB)

Métodos heredados

Constantes

Cadena final estática pública OP_NAME

El nombre de esta operación, como lo conoce el motor central de TensorFlow.

Valor constante: "QuantizedMatMulWithBias"

Métodos públicos

public static QuantizedMatMulWithBias <W> create ( Alcance alcance, Operando <? extiende TType > a, Operando <? extiende TType > b, Operando <? extiende TType > sesgo, Operando < TFloat32 > minA, Operando < TFloat32 > maxA, Operando < TFloat32 > minB, Operando < TFloat32 > maxB, Clase<W> Salida, Opciones... opciones)

Método de fábrica para crear una clase que envuelve una nueva operación QuantizedMatMulWithBias.

Parámetros
alcance alcance actual
a Una matriz para multiplicar. Debe ser un tensor bidimensional de tipo "quint8".
b Una matriz que se va a multiplicar y debe ser un tensor bidimensional de tipo `qint8`.
inclinación Un tensor de polarización 1D con un tamaño que coincide con la dimensión interna de `b` (después de ser transpuesto si `transposed_b` no es cero).
minA El valor flotante que representa el valor "a" cuantificado más bajo.
máxA El valor flotante que representa el valor "a" cuantificado más alto.
minB El valor flotante que representa el valor "b" cuantificado más bajo.
máxB El valor flotante que representa el valor "b" cuantificado más alto.
opciones lleva valores de atributos opcionales
Devoluciones
  • una nueva instancia de QuantizedMatMulWithBias

público estático QuantizedMatMulWithBias.Options inputQuantMode (String inputQuantMode)

Parámetros
entradaQuantMode Modo de cuantificación de datos de entrada. Ya sea MIN_FIRST (predeterminado) o SCALED.

Salida pública <TFloat32> maxOut ()

El valor flotante que representa el valor de salida cuantificado más alto.

Salida pública <TFloat32> minOut ()

El valor flotante que representa el valor de salida cuantificado más bajo.

Salida pública <W> salida ()

pública estática QuantizedMatMulWithBias.Options transposeA (transposeA booleana)

Parámetros
transponerA Si es verdadero, "a" se transpone antes de la multiplicación.

pública estática QuantizedMatMulWithBias.Options transposeB (transposeB booleana)

Parámetros
transponerB Si es verdadero, "b" se transpone antes de la multiplicación.