Nhà xây dựng công cộng
Phương pháp công khai
tĩnh <T mở rộng TNumber , U mở rộng TNumber > Toán hạng | thưa thớtSoftmaxCrossEntropyWithLogits ( Phạm vi phạm vi, nhãn Toán hạng <T>, nhật ký Toán hạng <U>) Tính toán entropy chéo softmax thưa thớt giữa logits và labels . |
Phương pháp kế thừa
Nhà xây dựng công cộng
công khai SparseSoftmaxCrossEntropyWithLogits ()
Phương pháp công khai
public static Toán hạng thưaSoftmaxCrossEntropyWithLogits ( Phạm vi phạm vi, nhãn Toán hạng <T>, nhật ký Toán hạng <U>)
Tính toán entropy chéo softmax thưa thớt giữa logits
và labels
.
Đo lường sai số xác suất trong các nhiệm vụ phân loại riêng biệt trong đó các lớp loại trừ lẫn nhau (mỗi mục nằm trong chính xác một lớp). Ví dụ: mỗi hình ảnh CIFAR-10 được gắn nhãn bằng một và chỉ một nhãn: hình ảnh có thể là một con chó hoặc một chiếc xe tải, nhưng không được cả hai.
GHI CHÚ:
Đối với hoạt động này, xác suất của một nhãn nhất định được coi là độc quyền. Nghĩa là, các lớp mềm không được phép và vectơ labels
phải cung cấp một chỉ mục cụ thể duy nhất cho lớp thực sự cho mỗi hàng logits
(mỗi mục nhập minibatch). Để phân loại softmax mềm với phân bố xác suất cho mỗi mục nhập, ERROR(/org.tensorflow.op.NnOps#softmaxCrossEntropyWithLogits)
.
CẢNH BÁO:
Hoạt động này yêu cầu các nhật ký không được chia tỷ lệ vì nó thực hiện softmax
trên logits
nội bộ để đạt hiệu quả. Không gọi op này với đầu ra là softmax
vì nó sẽ tạo ra kết quả không chính xác.
Trường hợp sử dụng phổ biến là có nhật ký hình dạng [batchSize, numClasses]
và có nhãn hình dạng [batchSize]
, nhưng kích thước cao hơn được hỗ trợ, trong trường hợp đó, thứ nguyên dim
-th được giả định là có kích thước numClasses
. logits
phải cóTFloat16
, TFloat32
, hoặc TFloat64
, và labels
phải có dtype là TInt32
hoặc TInt64
.
Thông số
phạm vi | phạm vi hiện tại |
---|---|
nhãn | Tensor có hình dạng [d_0, d_1, ..., d_{r-1}] (trong đó r là thứ hạng của labels và kết quả) và kiểu dữ liệu là TInt32 hoặc TInt64 . Mỗi mục trong labels phải là một chỉ mục trong [0, numClasses) . Các giá trị khác sẽ đưa ra một ngoại lệ khi op này được chạy trên CPU và trả về NaN cho các hàng mất và độ dốc tương ứng trên GPU. |
nhật ký | Kích hoạt trên mỗi nhãn (thường là đầu ra tuyến tính) có hình dạng [d_0, d_1, ..., d_{r-1}, numClasses] và dataType của TFloat16 , TFloat32 hoặc TFloat64 . Những năng lượng kích hoạt này được hiểu là xác suất nhật ký không chuẩn hóa. |
Trả lại
- Một
Tensor
có cùng hình dạng vớilabels
và cùng loại vớilogits
có tổn thất entropy chéo softmax.
Ném
Ngoại lệ Đối số bất hợp pháp | Nếu logit là vô hướng (cần có hạng >= 1) hoặc nếu hạng của nhãn không bằng hạng của logit trừ đi một. |
---|