ดำเนินการคูณเมทริกซ์เชิงปริมาณของ `a` ด้วยเมทริกซ์ `b` โดยมีอคติบวกและ relu และกำหนดปริมาณฟิวชั่นใหม่
อินพุตต้องเป็นเมทริกซ์สองมิติและเวกเตอร์ไบแอส 1D และมิติภายในของ `a` (หลังจากถูกย้ายหาก `transpose_a` ไม่ใช่ศูนย์) จะต้องตรงกับมิติภายนอกของ `b` (หลังจากถูกย้ายแล้ว หาก `transposed_b` ไม่ใช่ศูนย์) จากนั้นดำเนินการเพิ่มการออกอากาศด้วยค่าอคติกับผลการคูณเมทริกซ์ ขนาดอคติต้องตรงกับขนาดภายในของ `b` จากนั้นทำการเปิดใช้งาน relu เพื่อให้ได้ผลลัพธ์ที่ไม่เป็นลบ จากนั้นทำการคำนวณใหม่เพื่อให้ได้ผลลัพธ์ uint8 สุดท้าย
คลาสที่ซ้อนกัน
ระดับ | QuantizedMatMulWithBiasAndReluAndRequantize.Options | แอ็ตทริบิวต์ทางเลือกสำหรับ QuantizedMatMulWithBiasAndReluAndRequantize |
ค่าคงที่
สตริง | OP_NAME | ชื่อของ op นี้ ซึ่งรู้จักกันในชื่อของเอ็นจิ้นหลัก TensorFlow |
วิธีการสาธารณะ
คงที่ <W ขยาย TType > QuantizedMatMulWithBiasAndReluAndRequantize <W> | สร้าง ( ขอบเขต ขอบเขต ตัวดำเนินการ <? ขยาย TType > a, ตัวถูกดำเนินการ <? ขยาย TType > b, ตัว ถูกดำเนินการ <? ขยาย TType > อคติ, ตัวถูกดำเนินการ < TFloat32 > minA, ตัวถูกดำเนิน การ < TFloat32 > maxA, ตัวดำเนินการ < TFloat32 > minB, ตัวถูกดำเนินการ < TFloat32 > maxB, ตัวดำเนินการ < TFloat32 > minFreezedOutput, ตัวดำเนินการ < TFloat32 > maxFreezedOutput, Class<W> Toutput, ตัวเลือก... ตัวเลือก) วิธีการจากโรงงานเพื่อสร้างคลาสที่รวมการดำเนินการ QuantizedMatMulWithBiasAndReluAndRequantize ใหม่ |
QuantizedMatMulWithBiasAndReluAndRequantize.Options แบบคงที่ | inputQuantMode (สตริง inputQuantMode) |
เอาท์พุต < TFloat32 > | แม็กซ์เอาท์ () ค่าทศนิยมที่ค่าเอาต์พุตที่มีปริมาณสูงสุดเป็นตัวแทน |
เอาท์พุต < TFloat32 > | นาทีออก () ค่าทศนิยมที่ค่าเอาท์พุตเชิงปริมาณต่ำสุดเป็นตัวแทน |
เอาท์พุต <W> | ออก () |
QuantizedMatMulWithBiasAndReluAndRequantize.Options แบบคงที่ | transposeA (บูลีนทรานสโพสเอ) |
QuantizedMatMulWithBiasAndReluAndRequantize.Options แบบคงที่ | transposeB (ทรานสโพสบูลีน B) |
วิธีการสืบทอด
ค่าคงที่
สตริงสุดท้ายแบบคงที่สาธารณะ OP_NAME
ชื่อของ op นี้ ซึ่งรู้จักกันในชื่อของเอ็นจิ้นหลัก TensorFlow
วิธีการสาธารณะ
สาธารณะคง QuantizedMatMulWithBiasAndReluAndRequantize <W> สร้าง (ขอบเขต ขอบเขต ตัวดำเนินการ <? ขยาย TType > a, ตัวถูกดำเนินการ <? ขยาย TType > b, ตัว ถูกดำเนินการ <? ขยาย TType > อคติ, ตัวถูก ดำเนินการ < TFloat32 > minA, ตัวถูกดำเนินการ < TFloat32 > maxA, ตัวถูกดำเนินการ < TFloat32 > minB, ตัวดำเนินการ < TFloat32 > maxB, ตัวดำเนินการ < TFloat32 > minFreezedOutput, ตัวดำเนินการ < TFloat32 > maxFreezedOutput, Class<W> Toutput, ตัวเลือก... ตัวเลือก)
วิธีการจากโรงงานเพื่อสร้างคลาสที่รวมการดำเนินการ QuantizedMatMulWithBiasAndReluAndRequantize ใหม่
พารามิเตอร์
ขอบเขต | ขอบเขตปัจจุบัน |
---|---|
ก | เมทริกซ์ที่จะคูณ ต้องเป็นเทนเซอร์สองมิติประเภท `quint8` |
ข | เมทริกซ์ที่จะคูณและต้องเป็นเทนเซอร์สองมิติประเภท "qint8" |
อคติ | เทนเซอร์อคติ 1D ที่มีขนาดตรงกับขนาดภายใน `b` (หลังจากถูกย้ายหาก `transposed_b` ไม่ใช่ศูนย์) |
มินเอ | ค่าทศนิยมที่ค่า `a` เชิงปริมาณต่ำสุดเป็นตัวแทน |
แม็กซ์เอ | ค่าทศนิยมที่ค่า "a" ที่มีปริมาณสูงสุดเป็นตัวแทน |
มินบี | ค่าทศนิยมที่ค่า `b` เชิงปริมาณต่ำสุดเป็นตัวแทน |
แม็กซ์บี | ค่าทศนิยมที่แทนค่า `b` เชิงปริมาณสูงสุด |
minFreezedOutput | ค่าทศนิยมที่ค่าเอาต์พุตที่มีปริมาณสูงสุดหลังจากกำหนดปริมาณใหม่ |
ตัวเลือก | มีค่าแอตทริบิวต์ทางเลือก |
การส่งคืน
- อินสแตนซ์ใหม่ของ QuantizedMatMulWithBiasAndReluAndRequantize
สาธารณะ QuantizedMatMulWithBiasAndReluAndRequantize.Options inputQuantMode (สตริง inputQuantMode)
พารามิเตอร์
inputQuantMode | โหมดการหาปริมาณข้อมูลอินพุต MIN_FIRST(ค่าเริ่มต้น) หรือ SCALED |
---|
สาธารณะ QuantizedMatMulWithBiasAndReluAndRequantize.Options transposeA (บูลีน transposeA) สาธารณะ
พารามิเตอร์
ย้ายA | หากเป็นจริง `a` จะถูกย้ายก่อนการคูณ |
---|
สาธารณะคงที่ QuantizedMatMulWithBiasAndReluAndRequantize.Options transposeB (Boolean transposeB)
พารามิเตอร์
ย้ายB | หากเป็นจริง `b` จะถูกย้ายก่อนการคูณ |
---|