Realice una multiplicación de matriz cuantificada de `a` por la matriz `b` con adición de sesgo y fusión relu.
Las entradas deben ser matrices bidimensionales y vector de polarización 1D. Y la dimensión interior de `a` (después de transponerse si `transpose_a` es distinto de cero) debe coincidir con la dimensión exterior de `b` (después de transponerse si `transposed_b` es distinto de cero). Luego transmita la operación de suma con valores de sesgo en el resultado de la multiplicación de matrices. El tamaño del sesgo debe coincidir con la dimensión interna de `b`. Luego realice la activación de relu para obtener un resultado no negativo.
Clases anidadas
clase | QuantizedMatMulWithBiasAndRelu.Options | Atributos opcionales para QuantizedMatMulWithBiasAndRelu |
Métodos públicos
estático <V, T, U> QuantizedMatMulWithBiasAndRelu <V> | create ( Alcance alcance, Operando <T> a, Operando <U> b, Operando <Flotante> bias, Operando <Flotante> minA, Operando <Flotante> maxA, Operando <Flotante> minB, Operando <Flotante> maxB, Clase<V > Salida, Opciones... opciones) Método de fábrica para crear una clase que envuelve una nueva operación QuantizedMatMulWithBiasAndRelu. |
static QuantizedMatMulWithBiasAndRelu.Options | inputQuantMode (Cadena inputQuantMode) |
Salida <Flotante> | maxOut () El valor flotante que representa el valor de salida cuantificado más alto. |
Salida <Flotante> | salida min () El valor flotante que representa el valor de salida cuantificado más bajo. |
Salida <V> | fuera () |
static QuantizedMatMulWithBiasAndRelu.Options | transposeA (Booleano transposeA) |
static QuantizedMatMulWithBiasAndRelu.Options | transposeB (Booleano transposeB) |
Métodos Heredados
Métodos públicos
public static QuantizedMatMulWithBiasAndRelu <V> create ( Alcance alcance, Operando <T> a, Operando <U> b, Operando <Flotante> bias, Operando <Flotante> minA, Operando <Flotante> maxA, Operando <Flotante> minB, Operando <Flotante > maxB, Class<V> Toutput, Opciones... opciones)
Método de fábrica para crear una clase que envuelve una nueva operación QuantizedMatMulWithBiasAndRelu.
Parámetros
alcance | alcance actual |
---|---|
un | Una matriz a multiplicar. Debe ser un tensor bidimensional de tipo `quint8`. |
b | Una matriz a multiplicar y debe ser un tensor bidimensional de tipo `qint8`. |
parcialidad | Un tensor de polarización 1D cuyo tamaño coincide con la dimensión interna de `b` (después de transponerse si `transposed_b` no es cero). |
minA | El valor flotante que representa el valor `a` cuantificado más bajo. |
maxA | El valor flotante que representa el valor `a` cuantificado más alto. |
minB | El valor flotante que representa el valor `b` cuantificado más bajo. |
maxB | El valor flotante que representa el valor `b` cuantificado más alto. |
opciones | lleva valores de atributos opcionales |
Devoluciones
- una nueva instancia de QuantizedMatMulWithBiasAndRelu
public static QuantizedMatMulWithBiasAndRelu.Options inputQuantMode (String inputQuantMode)
Parámetros
inputQuantMode | Modo de cuantificación de datos de entrada. MIN_FIRST (predeterminado) o ESCALADO. |
---|
Salida pública <Flotante> maxOut ()
El valor flotante que representa el valor de salida cuantificado más alto.
Salida pública <Flotante> minOut ()
El valor flotante que representa el valor de salida cuantificado más bajo.
public static QuantizedMatMulWithBiasAndRelu.Options transposeA (Boolean transposeA)
Parámetros
transponerA | Si es verdadero, `a` se transpone antes de la multiplicación. |
---|
public static QuantizedMatMulWithBiasAndRelu.Options transposeB (Boolean transposeB)
Parámetros
transponerB | Si es verdadero, `b` se transpone antes de la multiplicación. |
---|