SparseSoftmaxCrossEntropyWithLogits

klasa publiczna SparseSoftmaxCrossEntropyWithLogits

Konstruktorzy publiczni

Metody publiczne

statyczny <T rozszerza TNumber , U rozszerza TNumber > Operand
sparseSoftmaxCrossEntropyWithLogits (zakres zakresu , etykiety argumentów <T>, logity argumentów <U>)
Oblicza rzadką entropię krzyżową softmax pomiędzy logits i labels .

Metody dziedziczone

Konstruktorzy publiczni

public SparseSoftmaxCrossEntropyWithLogits ()

Metody publiczne

public static Operand sparseSoftmaxCrossEntropyWithLogits (zakres zakresu , etykiety argumentów <T>, logity argumentów <U>)

Oblicza rzadką entropię krzyżową softmax pomiędzy logits i labels .

Mierzy błąd prawdopodobieństwa w zadaniach klasyfikacji dyskretnej, w których klasy wzajemnie się wykluczają (każdy wpis należy do dokładnie jednej klasy). Na przykład każdy obraz CIFAR-10 jest oznaczony jedną i tylko jedną etykietą: obraz może przedstawiać psa lub ciężarówkę, ale nie jedno i drugie.

NOTATKA:

W przypadku tej operacji prawdopodobieństwo danej etykiety uważa się za wyłączne. Oznacza to, że klasy miękkie nie są dozwolone, a wektor labels musi zapewniać pojedynczy, specyficzny indeks dla prawdziwej klasy dla każdego wiersza logits (każdego wpisu minibatch). W przypadku miękkiej klasyfikacji softmax z rozkładem prawdopodobieństwa dla każdego wpisu ERROR(/org.tensorflow.op.NnOps#softmaxCrossEntropyWithLogits) .

OSTRZEŻENIE:

Ta operacja oczekuje nieskalowanych logitów, ponieważ wewnętrznie wykonuje softmax na logits w celu zwiększenia wydajności. Nie wywołuj tej operacji z wyjściem softmax , ponieważ spowoduje to nieprawidłowe wyniki.

Typowym przypadkiem użycia są logity o kształcie [batchSize, numClasses] i etykiety o kształcie [batchSize] , ale obsługiwane są wyższe wymiary, w którym to przypadku zakłada się, że wymiar dim ma rozmiar numClasses . logits muszą mieć typ danych TFloat16 , TFloat32 lub TFloat64 , a labels muszą mieć dtype TInt32 lub TInt64 .

Parametry
zakres aktualny zakres
etykiety Tensor kształtu [d_0, d_1, ..., d_{r-1}] (gdzie r to ranga labels i wynik), a typ danych to TInt32 lub TInt64 . Każdy wpis w labels musi być indeksem w [0, numClasses) . Inne wartości zgłoszą wyjątek, gdy ta operacja zostanie uruchomiona na procesorze i zwrócą NaN dla odpowiednich wierszy strat i gradientów na GPU.
logity Aktywacje na etykietę (zwykle wyjście liniowe) kształtu [d_0, d_1, ..., d_{r-1}, numClasses] i dataType TFloat16 , TFloat32 lub TFloat64 . Te energie aktywacji są interpretowane jako nieznormalizowane prawdopodobieństwa logarytmiczne.
Zwroty
  • Tensor o tym samym kształcie co labels i tego samego typu co logits z utratą entropii krzyżowej typu softmax.
Rzuca
Wyjątek IllegalArgument Jeśli logity są skalarami (muszą mieć rangę >= 1) lub jeśli ranga etykiet nie jest równa rangi logitów minus jeden.