공개 최종 클래스 QuantizedMatMulWithBiasAndReluAndReQuantize
바이어스 덧셈과 relu 및 재양자화 융합을 사용하여 행렬 'b'로 'a'의 양자화된 행렬 곱셈을 수행합니다.
입력은 2차원 행렬과 1D 바이어스 벡터여야 합니다. 그리고 `a`의 내부 차원(`transpose_a`가 0이 아닌 경우 전치된 후)은 `b`의 외부 차원(`transposed_b`가 0이 아닌 경우 전치된 후)과 일치해야 합니다. 그런 다음 행렬 곱셈 결과에 대한 바이어스 값을 사용하여 브로드캐스트 추가 작업을 수행합니다. 바이어스 크기는 'b'의 내부 차원과 일치해야 합니다. 그런 다음 relu 활성화를 수행하여 음수가 아닌 결과를 얻으십시오. 그런 다음 재양자화 작업을 수행하여 최종 uint8 결과를 얻습니다.
중첩 클래스
수업 | QuantizedMatMulWithBiasAndReluAndReQuantize.Options | QuantizedMatMulWithBiasAndReluAndRequantize 에 대한 선택적 속성 |
상수
끈 | OP_NAME | TensorFlow 코어 엔진에서 알려진 이 작업의 이름 |
공개 방법
static <W는 TType을 확장합니다. > QuantizedMatMulWithBiasAndReluAndReQuantize <W> | create ( 범위 범위, 피연산자 <? 확장 TType > a, 피연산자 <? 확장 TType > b, 피연산자 <? 확장 TType > 바이어스, 피연산자 < TFloat32 > minA, 피연산자 < TFloat32 > maxA, 피연산자 < TFloat32 > minB, 피연산자 < TFloat32 > maxB, Operand < TFloat32 > minFreezedOutput, Operand < TFloat32 > maxFreezedOutput, Class<W> Toutput, 옵션... 옵션) 새로운 QuantizedMatMulWithBiasAndReluAndReQuantize 작업을 래핑하는 클래스를 생성하는 팩토리 메서드입니다. |
정적 QuantizedMatMulWithBiasAndReluAndReQuantize.Options | inputQuantMode (문자열 inputQuantMode) |
출력 < TFloat32 > | 한계에 달하다 () 가장 높은 양자화된 출력 값이 나타내는 부동 소수점 값입니다. |
출력 < TFloat32 > | 최소 출력 () 가장 낮은 양자화된 출력 값이 나타내는 부동 소수점 값입니다. |
출력 <W> | 밖으로 () |
정적 QuantizedMatMulWithBiasAndReluAndReQuantize.Options | transposeA (부울 전치 A) |
정적 QuantizedMatMulWithBiasAndReluAndReQuantize.Options | transposeB (부울 전치 B) |
상속된 메서드
상수
공개 정적 최종 문자열 OP_NAME
TensorFlow 코어 엔진에서 알려진 이 작업의 이름
상수 값: "QuantizedMatMulWithBiasAndReluAndReQuantize"
공개 방법
public static QuantizedMatMulWithBiasAndReluAndReQuantize <W> create ( Scope 범위, 피연산자 <? 확장 TType > a, 피연산자 <? 확장 TType > b, 피연산자 <? 확장 TType > 바이어스, 피연산자 < TFloat32 > minA, 피연산자 < TFloat32 > maxA, 피연산자 < TFloat32 > minB, Operand < TFloat32 > maxB, Operand < TFloat32 > minFreezedOutput, Operand < TFloat32 > maxFreezedOutput, Class<W> Toutput, 옵션... 옵션)
새로운 QuantizedMatMulWithBiasAndReluAndReQuantize 작업을 래핑하는 클래스를 생성하는 팩토리 메서드입니다.
매개변수
범위 | 현재 범위 |
---|---|
ㅏ | 곱할 행렬입니다. 'quint8' 유형의 2차원 텐서여야 합니다. |
비 | 곱할 행렬이며 'qint8' 유형의 2차원 텐서여야 합니다. |
편견 | 'b'의 내부 차원과 크기가 일치하는 1D 바이어스 텐서('transposed_b'가 0이 아닌 경우 전치된 후). |
분A | 가장 낮은 양자화된 `a` 값이 나타내는 부동 소수점 값입니다. |
최대A | 가장 높은 양자화된 `a` 값이 나타내는 부동 소수점 값입니다. |
분B | 가장 낮은 양자화된 `b` 값이 나타내는 부동 소수점 값입니다. |
최대B | 가장 높은 양자화된 'b' 값이 나타내는 부동 소수점 값입니다. |
최소 고정 출력 | 재양자화 후 가장 높은 양자화된 출력 값인 부동 소수점 값입니다. |
옵션 | 선택적 속성 값을 전달합니다. |
보고
- QuantizedMatMulWithBiasAndReluAndReQuantize의 새로운 인스턴스
공개 정적 QuantizedMatMulWithBiasAndReluAndReQuantize.Options inputQuantMode (문자열 inputQuantMode)
매개변수
입력QuantMode | 입력 데이터 양자화 모드. MIN_FIRST(기본값) 또는 SCALED입니다. |
---|
공개 정적 QuantizedMatMulWithBiasAndReluAndReQuantize.Options transposeA (부울 transposeA)
매개변수
전치 A | true인 경우 `a`는 곱하기 전에 전치됩니다. |
---|
공개 정적 QuantizedMatMulWithBiasAndReluAndReQuantize.Options transposeB (부울 전치 B)
매개변수
B | true인 경우 'b'는 곱하기 전에 전치됩니다. |
---|