SparseSoftmaxCrossEntropyWithLogits

lớp công khai SparseSoftmaxCrossEntropyWithLogits

Nhà xây dựng công cộng

Phương pháp công khai

tĩnh <T mở rộng TNumber , U mở rộng TNumber > Toán hạng
thưa thớtSoftmaxCrossEntropyWithLogits ( Phạm vi phạm vi, nhãn Toán hạng <T>, nhật ký Toán hạng <U>)
Tính toán entropy chéo softmax thưa thớt giữa logitslabels .

Phương pháp kế thừa

Nhà xây dựng công cộng

công khai SparseSoftmaxCrossEntropyWithLogits ()

Phương pháp công khai

public static Toán hạng thưaSoftmaxCrossEntropyWithLogits ( Phạm vi phạm vi, nhãn Toán hạng <T>, nhật ký Toán hạng <U>)

Tính toán entropy chéo softmax thưa thớt giữa logitslabels .

Đo lường sai số xác suất trong các nhiệm vụ phân loại riêng biệt trong đó các lớp loại trừ lẫn nhau (mỗi mục nằm trong chính xác một lớp). Ví dụ: mỗi hình ảnh CIFAR-10 được gắn nhãn bằng một và chỉ một nhãn: hình ảnh có thể là một con chó hoặc một chiếc xe tải, nhưng không được cả hai.

GHI CHÚ:

Đối với hoạt động này, xác suất của một nhãn nhất định được coi là độc quyền. Nghĩa là, các lớp mềm không được phép và vectơ labels phải cung cấp một chỉ mục cụ thể duy nhất cho lớp thực sự cho mỗi hàng logits (mỗi mục nhập minibatch). Để phân loại softmax mềm với phân bố xác suất cho mỗi mục nhập, ERROR(/org.tensorflow.op.NnOps#softmaxCrossEntropyWithLogits) .

CẢNH BÁO:

Hoạt động này yêu cầu các nhật ký không được chia tỷ lệ vì nó thực hiện softmax trên logits nội bộ để đạt hiệu quả. Không gọi op này với đầu ra là softmax vì nó sẽ tạo ra kết quả không chính xác.

Trường hợp sử dụng phổ biến là có nhật ký hình dạng [batchSize, numClasses] và có nhãn hình dạng [batchSize] , nhưng kích thước cao hơn được hỗ trợ, trong trường hợp đó, thứ nguyên dim -th được giả định là có kích thước numClasses . logits phải có loại dữ liệu của TFloat16 , TFloat32 , hoặc TFloat64 , và labels phải có dtype là TInt32 hoặc TInt64 .

Thông số
phạm vi phạm vi hiện tại
nhãn Tensor có hình dạng [d_0, d_1, ..., d_{r-1}] (trong đó r là thứ hạng của labels và kết quả) và kiểu dữ liệu là TInt32 hoặc TInt64 . Mỗi mục trong labels phải là một chỉ mục trong [0, numClasses) . Các giá trị khác sẽ đưa ra một ngoại lệ khi op này được chạy trên CPU và trả về NaN cho các hàng mất và độ dốc tương ứng trên GPU.
nhật ký Kích hoạt trên mỗi nhãn (thường là đầu ra tuyến tính) có hình dạng [d_0, d_1, ..., d_{r-1}, numClasses] và dataType của TFloat16 , TFloat32 hoặc TFloat64 . Những năng lượng kích hoạt này được hiểu là xác suất nhật ký không chuẩn hóa.
Trả lại
  • Một Tensor có cùng hình dạng với labels và cùng loại với logits có tổn thất entropy chéo softmax.
Ném
Ngoại lệ Đối số bất hợp pháp Nếu logit là vô hướng (cần có hạng >= 1) hoặc nếu hạng của nhãn không bằng hạng của logit trừ đi một.