CTCLossV2

publiczna klasa końcowa CTCLossV2

Oblicza stratę CTC (prawdopodobieństwo logarytmiczne) dla każdego wpisu partii. Oblicza również

gradient. Ta klasa wykonuje za Ciebie operację softmax, więc dane wejściowe powinny być np. liniowymi projekcjami wyjść za pomocą LSTM.

Klasy zagnieżdżone

klasa Opcje CTCLossV2 Opcjonalne atrybuty dla CTCLossV2

Metody publiczne

statyczny CTCLossV2
utwórz (zakres zakresu , argument <Float> wejścia, argument <Long> etykietyIndices, argument <liczba całkowita> etykietyValues, argument <liczba całkowita> długość sekwencji, opcje... opcje)
Metoda fabryczna służąca do tworzenia klasy opakowującej nową operację CTCLossV2.
statyczne opcje CTCLossV2
ctcMergeRepeated (Boolean ctcMergeRepeated)
Wyjście <Pływak>
gradient ()
Gradient „straty”.
statyczne opcje CTCLossV2
ignorowaćLongerOutputsThanInputs (Boolean ignorowaniaLongerOutputsThanInputs)
Wyjście <Pływak>
strata ()
Wektor (partia) zawierający logarytmiczne prawdopodobieństwa.
statyczne opcje CTCLossV2
preprocessCollapseRepeated (Boolean preprocessCollapseRepeated)

Metody dziedziczone

Metody publiczne

public static CTCLossV2 create (zakres zakresu , argument <Float> wejścia, argument <Long> etykietyIndices, argument <liczba całkowita> etykietyValues, argument < liczba całkowita> długość sekwencji, opcje... opcje)

Metoda fabryczna służąca do tworzenia klasy opakowującej nową operację CTCLossV2.

Parametry
zakres aktualny zakres
wejścia 3-D, kształt: `(max_time x partia_size x num_classes)`, logity. Domyślna pusta etykieta to 0, a nie num_classes - 1.
etykietyIndeksy Indeksy obiektu `SparseTensor `. `labels_indices(i, :) == [b, t]` oznacza, że ​​`labels_values(i)` przechowuje identyfikator dla `(partia b, czas t)`.
etykietyWartości Wartości (etykiety) powiązane z daną partią i czasem.
sekwencjaDługość Wektor zawierający długości sekwencji (partia).
opcje przenosi opcjonalne wartości atrybutów
Zwroty
  • nowa instancja CTCLossV2

public static CTCLossV2.Options ctcMergeRepeated (Boolean ctcMergeRepeated)

Parametry
ctcMergePowtórzone Skalarny. Jeśli ustawione na false, podczas obliczania CTC powtarzające się, niepuste etykiety nie będą łączone i będą interpretowane jako indywidualne etykiety. Jest to uproszczona wersja CTC.

public Output <Float> gradient ()

Gradient „straty”. 3-D, kształt: `(maks._czas x rozmiar_wsadu x liczba_klas)`.

public static CTCLossV2.Options ignorowanieLongerOutputsThanInputs (Boolean ignorujeLongerOutputsThanInputs)

Parametry
ignoruj ​​dłuższe dane wyjściowe niż wejścia Skalarny. Jeśli ustawione na true, podczas obliczania CTC elementy, które mają dłuższe sekwencje wyjściowe niż sekwencje wejściowe, są pomijane: nie przyczyniają się do składnika straty i mają zerowy gradient.

publiczna utrata wyjścia <Float> ()

Wektor (partia) zawierający logarytmiczne prawdopodobieństwa.

public static CTCLossV2.Options proces wstępnyCollapseRepeated (proces wstępny boolowskiCollapseRepeated)

Parametry
proces wstępnyZwińPowtarzane Skalarny, jeśli ma wartość true, to powtarzające się etykiety są zwijane przed obliczeniem CTC.