Konstruktorzy publiczni
Metody publiczne
| statyczny <T rozszerza TNumber , U rozszerza TNumber > Operand | sparseSoftmaxCrossEntropyWithLogits (zakres zakresu , etykiety argumentów <T>, logity argumentów <U>) Oblicza rzadką entropię krzyżową softmax pomiędzy logits i labels . |
Metody dziedziczone
Konstruktorzy publiczni
public SparseSoftmaxCrossEntropyWithLogits ()
Metody publiczne
public static Operand sparseSoftmaxCrossEntropyWithLogits (zakres zakresu , etykiety argumentów <T>, logity argumentów <U>)
Oblicza rzadką entropię krzyżową softmax pomiędzy logits i labels .
Mierzy błąd prawdopodobieństwa w zadaniach klasyfikacji dyskretnej, w których klasy wzajemnie się wykluczają (każdy wpis należy do dokładnie jednej klasy). Na przykład każdy obraz CIFAR-10 jest oznaczony jedną i tylko jedną etykietą: obraz może przedstawiać psa lub ciężarówkę, ale nie jedno i drugie.
NOTATKA:
W przypadku tej operacji prawdopodobieństwo danej etykiety uważa się za wyłączne. Oznacza to, że klasy miękkie nie są dozwolone, a wektor labels musi zapewniać pojedynczy, specyficzny indeks dla prawdziwej klasy dla każdego wiersza logits (każdego wpisu minibatch). W przypadku miękkiej klasyfikacji softmax z rozkładem prawdopodobieństwa dla każdego wpisu ERROR(/org.tensorflow.op.NnOps#softmaxCrossEntropyWithLogits) .
OSTRZEŻENIE:
Ta operacja oczekuje nieskalowanych logitów, ponieważ wewnętrznie wykonuje softmax na logits w celu zwiększenia wydajności. Nie wywołuj tej operacji z wyjściem softmax , ponieważ spowoduje to nieprawidłowe wyniki.
Typowym przypadkiem użycia są logity o kształcie [batchSize, numClasses] i etykiety o kształcie [batchSize] , ale obsługiwane są wyższe wymiary, w którym to przypadku zakłada się, że wymiar dim ma rozmiar numClasses . logits muszą miećTFloat16 , TFloat32 lub TFloat64 , a labels muszą mieć dtype TInt32 lub TInt64 .
Parametry
| zakres | aktualny zakres |
|---|---|
| etykiety | Tensor kształtu [d_0, d_1, ..., d_{r-1}] (gdzie r to ranga labels i wynik), a typ danych to TInt32 lub TInt64 . Każdy wpis w labels musi być indeksem w [0, numClasses) . Inne wartości zgłoszą wyjątek, gdy ta operacja zostanie uruchomiona na procesorze i zwrócą NaN dla odpowiednich wierszy strat i gradientów na GPU. |
| logity | Aktywacje na etykietę (zwykle wyjście liniowe) kształtu [d_0, d_1, ..., d_{r-1}, numClasses] i dataType TFloat16 , TFloat32 lub TFloat64 . Te energie aktywacji są interpretowane jako nieznormalizowane prawdopodobieństwa logarytmiczne. |
Zwroty
-
Tensoro tym samym kształcie colabelsi tego samego typu cologitsz utratą entropii krzyżowej typu softmax.
Rzuca
| Wyjątek IllegalArgument | Jeśli logity są skalarami (muszą mieć rangę >= 1) lub jeśli ranga etykiet nie jest równa rangi logitów minus jeden. |
|---|