Выполняет квантованное матричное умножение a на матрицу b с добавлением смещения.
Входные данные должны быть двумерными матрицами и одномерным вектором смещения. А внутреннее измерение `a` (после транспонирования, если `transpose_a` не равно нулю) должно соответствовать внешнему измерению `b` (после транспонирования, если `transpose_b` не равно нулю). Затем выполните операцию широковещательного сложения со значениями смещения результата умножения матрицы. Размер смещения должен соответствовать внутреннему размеру b.
Вложенные классы
сорт | QuantizedMatMulWithBias.Options | Дополнительные атрибуты для QuantizedMatMulWithBias |
Публичные методы
static <W, T, U, V> QuantizedMatMulWithBias <W> | |
статический QuantizedMatMulWithBias.Options | inputQuantMode (строка inputQuantMode) |
Выход <С плавающей запятой> | использовать полностью () Значение с плавающей запятой, которое представляет наибольшее квантованное выходное значение. |
Выход <С плавающей запятой> | минаут () Значение с плавающей запятой, которое представляет наименьшее квантованное выходное значение. |
Выход <Вт> | вне () |
статический QuantizedMatMulWithBias.Options | transposeA (логическое значение transposeA) |
статический QuantizedMatMulWithBias.Options | transposeB (логическое значение transposeB) |
Унаследованные методы
Публичные методы
public static QuantizedMatMulWithBias <W> create ( Область действия, Операнд <T> a, Операнд <U> b, Смещение операнда <V>, Операнд <Float> minA, Операнд <Float> maxA, Операнд <Float> minB, Операнд <Float > maxB, Class<W> Toutput, Options... options)
Фабричный метод для создания класса, обертывающего новую операцию QuantizedMatMulWithBias.
Параметры
объем | текущий объем |
---|---|
а | Матрица, которую нужно умножить. Должен быть двумерным тензором типа «quint8». |
б | Матрица, подлежащая умножению, должна быть двумерным тензором типа qint8. |
предвзятость | Одномерный тензор смещения, размер которого соответствует внутреннему размеру `b` (после транспонирования, если `transpose_b` не равно нулю). |
минА | Значение с плавающей запятой, которое представляет наименьшее квантованное значение a. |
МаксА | Значение с плавающей запятой, которое представляет наибольшее квантованное значение `a`. |
минБ | Значение с плавающей запятой, которое представляет наименьшее квантованное значение `b`. |
МаксБ | Значение с плавающей запятой, которое представляет наибольшее квантованное значение `b`. |
параметры | содержит значения необязательных атрибутов |
Возврат
- новый экземпляр QuantizedMatMulWithBias
общедоступный статический QuantizedMatMulWithBias.Options inputQuantMode (String inputQuantMode)
Параметры
вводQuantMode | Режим квантования входных данных. Либо MIN_FIRST (по умолчанию), либо SCALED. |
---|
публичный вывод <Float> maxOut ()
Значение с плавающей запятой, которое представляет наибольшее квантованное выходное значение.
публичный вывод <Float> minOut ()
Значение с плавающей запятой, которое представляет наименьшее квантованное выходное значение.
public static QuantizedMatMulWithBias.Options transposeA (Boolean transposeA)
Параметры
транспонироватьА | Если это правда, `a` транспонируется перед умножением. |
---|
public static QuantizedMatMulWithBias.Options transposeB (Boolean transposeB)
Параметры
транспонировать Б | Если это правда, `b` транспонируется перед умножением. |
---|