ทำการคูณเมทริกซ์เชิงปริมาณของ `a' ด้วยเมทริกซ์ `b` ด้วยการเพิ่มอคติและ relu และ requantize ฟิวชั่น
อินพุตต้องเป็นเมทริกซ์สองมิติและเวกเตอร์อคติ 1D และมิติภายในของ "a" (หลังจากที่ถูกย้ายหาก "transpose_a" ไม่ใช่ศูนย์) จะต้องตรงกับมิติภายนอกของ "b" (หลังจากถูกย้ายหาก "transposed_b" ไม่ใช่ศูนย์) จากนั้นทำการออกอากาศเพิ่มด้วยค่าอคติบนผลการคูณเมทริกซ์ ขนาดอคติต้องตรงกับมิติภายในของ "b" จากนั้นทำการเปิดใช้งาน relu เพื่อให้ได้ผลลัพธ์ที่ไม่เป็นลบ จากนั้นทำ requantize operation เพื่อรับผลลัพธ์ uint8 สุดท้าย
คลาสที่ซ้อนกัน
ระดับ | QuantizedMatMulWithBiasAndReluAndRequantize.Options | คุณลักษณะที่จำเป็นสำหรับการ QuantizedMatMulWithBiasAndReluAndRequantize |
วิธีการสาธารณะ
คง <W, T, U, V> QuantizedMatMulWithBiasAndReluAndRequantize <W> | สร้าง ( ขอบเขต ขอบเขต Operand <T> เป็น ตัวถูกดำเนินการ <u> B, Operand <V> อคติ Operand <ลอย> น่า Operand <ลอย> MAXA, Operand <ลอย> minB, Operand <ลอย> maxB, Operand <ลอย > minFreezedOutput, Operand <ลอย> maxFreezedOutput ชั้น <W> Toutput, ตัวเลือก ... ตัวเลือก) วิธีการจากโรงงานเพื่อสร้างคลาสที่ปิดการดำเนินการ QuantizedMatMulWithBiasAndReluAndRequantize ใหม่ |
คง QuantizedMatMulWithBiasAndReluAndRequantize.Options | inputQuantMode (String inputQuantMode) |
เอาท์พุท <ลอย> | maxout () ค่าทศนิยมที่แสดงค่าเอาต์พุตเชิงปริมาณสูงสุด |
เอาท์พุท <ลอย> | minOut () ค่าทศนิยมที่แสดงค่าเอาต์พุตเชิงปริมาณต่ำสุด |
เอาท์พุท <W> | ออก () |
คง QuantizedMatMulWithBiasAndReluAndRequantize.Options | transposeA (บูลีน transposeA) |
คง QuantizedMatMulWithBiasAndReluAndRequantize.Options | transposeB (บูลีน transposeB) |
วิธีการสืบทอด
วิธีการสาธารณะ
สาธารณะคง QuantizedMatMulWithBiasAndReluAndRequantize <W> สร้าง ( ขอบเขต ขอบเขต Operand <T> เป็น ตัวถูกดำเนินการ <u> B, Operand <V> อคติ Operand <ลอย> น่า Operand <ลอย> MAXA, Operand <ลอย> minB, Operand <ลอย > maxB, Operand <ลอย> minFreezedOutput, Operand <ลอย> maxFreezedOutput ชั้น <W> Toutput, ตัวเลือก ... ตัวเลือก)
วิธีการจากโรงงานเพื่อสร้างคลาสที่ปิดการดำเนินการ QuantizedMatMulWithBiasAndReluAndRequantize ใหม่
พารามิเตอร์
ขอบเขต | ขอบเขตปัจจุบัน |
---|---|
NS | เมทริกซ์ที่จะคูณ ต้องเป็นเมตริกซ์สองมิติของประเภท "quint8" |
NS | เมทริกซ์ที่จะคูณและต้องเป็นเมตริกซ์สองมิติประเภท "qint8" |
อคติ | อคติ 1D ที่มีขนาดตรงกับมิติภายในของ `b' (หลังจากถูกย้ายหาก `transposed_b` ไม่ใช่ศูนย์) |
minA | ค่าทศนิยมที่ค่า `a` เชิงปริมาณต่ำที่สุดแสดงถึง |
maxA | ค่าทศนิยมที่ค่า `a` เชิงปริมาณสูงสุดแสดงถึง |
minB | ค่าทศนิยมที่ค่า `b` เชิงปริมาณต่ำที่สุดแสดงถึง |
maxB | ค่าทศนิยมที่แสดงค่า `b` เชิงปริมาณสูงสุด |
minFreezedOutput | ค่าทศนิยมที่ค่าเอาต์พุต quantized สูงสุดหลังจากปรับใหม่ |
ตัวเลือก | ดำเนินการค่าแอตทริบิวต์ทางเลือก |
คืนสินค้า
- อินสแตนซ์ใหม่ของ QuantizedMatMulWithBiasAndReluAndRequantize
สาธารณะคง QuantizedMatMulWithBiasAndReluAndRequantize.Options inputQuantMode (String inputQuantMode)
พารามิเตอร์
อินพุตQuantMode | ป้อนข้อมูลโหมด quantization MIN_FIRST(ค่าเริ่มต้น) หรือ SCALED |
---|
สาธารณะคง QuantizedMatMulWithBiasAndReluAndRequantize.Options transposeA (บูลีน transposeA)
พารามิเตอร์
ทรานสโพสA | ถ้าเป็นจริง `a' จะถูกย้ายก่อนการคูณ |
---|
สาธารณะคง QuantizedMatMulWithBiasAndReluAndRequantize.Options transposeB (บูลีน transposeB)
พารามิเตอร์
transposeB | ถ้าเป็นจริง `b` จะถูกย้ายก่อนการคูณ |
---|