Lakukan titik terkuantisasi hibrida dari Tensor float `lhs` dan Tensor terkuantisasi `rhs`.
Diberikan float `lhs` dan `rhs` terkuantisasi, secara internal melakukan kuantisasi pada `lhs`, dan kemudian melakukan titik terkuantisasi pada lhs dan `rhs` terkuantisasi. Kuantisasi internal pada `lhs` adalah kuantisasi ke qint8, dynamic range, per-batch (per-axis sepanjang sumbu 0), asimetris, dan bukan rentang sempit (range adalah [-128, 127]). `lhs` dan `rhs` harus Tensor 2D dan lhs.dim_size(1) harus cocok dengan rhs.dim_size(0). `rhs` harus dikuantisasi Tensor, di mana nilai datanya dikuantisasi menggunakan rumus: quantized_data = clip(original_data / scale + zero_point, quantization_min_val, quantization_max_val).
Kelas Bersarang
kelas | UniformQuantizedDotHybrid.Options | Atribut opsional untuk UniformQuantizedDotHybrid |
Metode Publik
Keluaran <V> | sebagai Keluaran () Mengembalikan pegangan simbolis tensor. |
static <V perpanjang Angka, T perpanjang Angka, U> UniformQuantizedDotHybrid <V> | |
Keluaran <V> | keluaran () Tensor 2D keluaran Tout, yang bentuknya adalah (lhs.dim_size(0), rhs.dim_size(1)). |
Seragam statisQuantizedDotHybrid.Options | rhsQuantizationAxis (Sumbu rhsQuantization Panjang) |
Metode yang Diwarisi
Metode Publik
Output publik <V> sebagai Output ()
Mengembalikan pegangan simbolis tensor.
Input ke operasi TensorFlow adalah output dari operasi TensorFlow lainnya. Metode ini digunakan untuk mendapatkan pegangan simbolis yang mewakili perhitungan input.
public static UniformQuantizedDotHybrid <V> buat ( Scope scope, Operand <T> lhs, Operand <U> rhs, Operand <Float> rhsScales, Operand <Integer> rhsZeroPoints, Class<V> Tout, Long rhsQuantizationMinVal, Long rhsValQuantization . .pilihan )
Metode pabrik untuk membuat kelas yang membungkus operasi UniformQuantizedDotHybrid baru.
Parameter
cakupan | lingkup saat ini |
---|---|
lhs | Harus Tensor 2D dari Tlhs. |
rhs | Harus Tensor 2D dari Trhs. |
rhsScales | Nilai float yang digunakan sebagai skala saat mengkuantisasi data asli yang diwakili rhs. Harus berupa Tensor skalar (kuantisasi per tensor) atau ukuran Tensor 1D (rhs.dim_size(1),) (kuantisasi per saluran). |
rhsZeroPoints | Nilai int32 digunakan sebagai titik_nol saat mengkuantisasi data asli yang diwakili oleh rhs. Kondisi bentuk yang sama dengan rhs_scales. |
Mengintip | Jenis Tensor keluaran. |
rhsKuantisasiMinVal | Nilai min dari data terkuantisasi yang disimpan dalam rhs. Misalnya, jika Trhs adalah qint8, ini harus diatur ke -127 jika rentang sempit terkuantisasi atau -128 jika tidak. |
rhsQuantizationMaxVal | Nilai maksimal dari data terkuantisasi yang disimpan dalam rhs. Misalnya, jika Trhs adalah qint8, ini harus disetel ke 127. |
pilihan | membawa nilai atribut opsional |
Kembali
- contoh baru UniformQuantizedDotHybrid
Keluaran publik <V> keluaran ()
Tensor 2D keluaran Tout, yang bentuknya adalah (lhs.dim_size(0), rhs.dim_size(1)). Data keluaran adalah data keluaran asli itu sendiri (Tidak terkuantisasi).
UniformQuantizedDotHybrid.Options publik statisQuantizationAxis (RhsQuantizationAxis panjang)
Parameter
rhsQuantizationAxis | Menunjukkan indeks dimensi tensor tempat kuantisasi per sumbu diterapkan untuk irisan sepanjang dimensi tersebut. Jika diatur ke -1 (default), ini menunjukkan kuantisasi per-tensor. Untuk operasi titik, hanya kuantisasi per tensor atau kuantisasi per saluran di sepanjang dimensi 1 yang didukung. Jadi, atribut ini harus disetel ke -1 atau 1. Nilai lain ditolak. |
---|