QuantizedMatMulWithBiasAndReluAndRequantize

lớp cuối cùng công khai QuantizedMatMulWithBiasAndReluAndRequantize

Thực hiện phép nhân ma trận lượng tử hóa của `a` với ma trận `b` với phép cộng độ lệch và relu và kết hợp lại lượng tử hóa.

Đầu vào phải là ma trận hai chiều và vectơ sai lệch 1D. Và chiều bên trong của `a` (sau khi được chuyển đổi nếu `transpose_a` khác 0) phải khớp với chiều bên ngoài của `b` (sau khi được chuyển đổi nếu `transpose_b` khác 0). Sau đó thực hiện thao tác cộng quảng bá với các giá trị sai lệch trên kết quả nhân ma trận. Kích thước thiên vị phải khớp với kích thước bên trong của `b`. Sau đó thực hiện kích hoạt relu để có kết quả không âm. Sau đó thực hiện thao tác định lượng lại để có kết quả uint8 cuối cùng.

Các lớp lồng nhau

lớp học Lượng tử hóaMatMulWithBiasAndReluAndRequantize.Options Thuộc tính tùy chọn cho QuantizedMatMulWithBiasAndReluAndRequantize

Phương pháp công khai

tĩnh <W, T, U, V> Lượng tử hóaMatMulWithBiasAndReluAndRequantize <W>
tạo ( Phạm vi phạm vi, Toán hạng <T> a, Toán hạng <U> b, Độ lệch Toán hạng <V>, Toán hạng <Float> minA, Toán hạng <Float> maxA, Toán hạng <Float> minB, Toán hạng <Float> maxB, Toán hạng <Float > tùy chọn minFreezedOutput, Toán hạng <Float> maxFreezedOutput, Lớp<W> Toutput, Tùy chọn... )
Phương thức gốc để tạo một lớp bao bọc một hoạt động QuantizedMatMulWithBiasAndReluAndRequantize mới.
tĩnh QuantizedMatMulWithBiasAndReluAndRequantize.Options
inputQuantMode (Chuỗi đầu vàoQuantMode)
Đầu ra <Float>
maxOut ()
Giá trị float mà giá trị đầu ra lượng tử hóa cao nhất đại diện.
Đầu ra <Float>
phútOut ()
Giá trị float mà giá trị đầu ra lượng tử hóa thấp nhất đại diện.
Đầu ra <W>
ngoài ()
tĩnh QuantizedMatMulWithBiasAndReluAndRequantize.Options
chuyển vịA (chuyển đổi BooleanA)
tĩnh QuantizedMatMulWithBiasAndReluAndRequantize.Options
transposeB (chuyển đổi BooleanB)

Phương pháp kế thừa

Phương pháp công khai

public static QuantizedMatMulWithBiasAndReluAndRequantize <W> create ( Phạm vi phạm vi, Toán hạng <T> a, Toán hạng <U> b, Toán hạng <V> thiên vị, Toán hạng <Float> minA, Toán hạng <Float> maxA, Toán hạng <Float> minB, Toán hạng <Float > maxB, Toán hạng <Float> minFreezedOutput, Toán hạng <Float> maxFreezedOutput, Lớp<W> Toutput, Tùy chọn... tùy chọn)

Phương thức gốc để tạo một lớp bao bọc một hoạt động QuantizedMatMulWithBiasAndReluAndRequantize mới.

Thông số
phạm vi phạm vi hiện tại
Một Một ma trận được nhân. Phải là tensor hai chiều thuộc loại `quint8`.
b Ma trận cần nhân và phải là tensor hai chiều thuộc loại `qint8`.
Thiên kiến Một tenxơ thiên vị 1D có kích thước khớp với kích thước bên trong của `b` (sau khi được hoán vị nếu `transpose_b` khác 0).
phútA Giá trị float mà giá trị `a` được lượng tử hóa thấp nhất đại diện.
tối đaA Giá trị float mà giá trị `a` được lượng tử hóa cao nhất đại diện.
phútB Giá trị float mà giá trị `b` được lượng tử hóa thấp nhất đại diện.
tối đaB Giá trị float mà giá trị `b` được lượng tử hóa cao nhất đại diện.
phútĐóng băngĐầu ra Giá trị float có giá trị đầu ra được lượng tử hóa cao nhất sau khi lượng tử hóa lại.
tùy chọn mang các giá trị thuộc tính tùy chọn
Trả lại
  • một phiên bản mới của QuantizedMatMulWithBiasAndReluAndRequantize

tĩnh công khai QuantizedMatMulWithBiasAndReluAndRequantize.Options inputQuantMode (Chuỗi đầu vàoQuantMode)

Thông số
đầu vàoQuantMode Chế độ lượng tử hóa dữ liệu đầu vào. MIN_FIRST(mặc định) hoặc SCALED.

Đầu ra công khai <Float> maxOut ()

Giá trị float mà giá trị đầu ra lượng tử hóa cao nhất đại diện.

Đầu ra công khai <Float> minOut ()

Giá trị float mà giá trị đầu ra lượng tử hóa thấp nhất đại diện.

Đầu ra công khai <W> out ()

tĩnh công khai QuantizedMatMulWithBiasAndReluAndRequantize.Options transposeA (Boolean transposeA)

Thông số
chuyển vịA Nếu đúng, `a` được hoán vị trước khi nhân.

tĩnh công khai QuantizedMatMulWithBiasAndReluAndRequantize.Options transposeB (Boolean transposeB)

Thông số
chuyển vịB Nếu đúng, `b` được chuyển đổi trước khi nhân.