Effectue un décodage gourmand sur les logits donnés en entrées.
Une note sur l'attribut merge_repeated : s'il est activé, lorsque les indices maximum des logits consécutifs sont les mêmes, seul le premier d'entre eux est émis. En étiquetant le blanc '*', la séquence "ABB * BB" devient "ABB" si merge_repeated = True et "ABBBB" si merge_repeated = False.
Quelle que soit la valeur de merge_repeated, si l'index maximum d'une heure et d'un lot donnés correspond au blanc, index `(num_classes - 1)`, aucun nouvel élément n'est émis.
Classes imbriquées
classe | CtcGreedyDecoder.Options | Attributs facultatifs pour CtcGreedyDecoder |
Constantes
Chaîne | OP_NAME | Le nom de cette opération, tel que connu par le moteur principal TensorFlow |
Méthodes publiques
statique <T étend TNumber > CtcGreedyDecoder <T> | |
Sortie < TInt64 > | Indices décodés () Matrice d'indices, taille `(total_decoded_outputs x 2)`, d'un `SparseTensor |
Sortie < TInt64 > | forme décodée () Vecteur de forme, taille `(2)`, du SparseTensor décodé. |
Sortie < TInt64 > | valeurs décodées () Vecteur de valeurs, taille : `(total_decoded_outputs)`, d'un `SparseTensor |
Sortie <T> | logProbabilité () Matrice, taille `(batch_size x 1)`, contenant les probabilités du journal de séquence. |
statique CtcGreedyDecoder.Options | mergeRepeated (fusion booléenne répétée) |
Méthodes héritées
Constantes
chaîne finale statique publique OP_NAME
Le nom de cette opération, tel que connu par le moteur principal TensorFlow
Méthodes publiques
public static CtcGreedyDecoder <T> créer (portée de la portée , entrées de l' opérande <T>, opérande <TInt32> séquenceLength, options... options)
Méthode d'usine pour créer une classe encapsulant une nouvelle opération CtcGreedyDecoder.
Paramètres
portée | portée actuelle |
---|---|
contributions | 3-D, forme : `(max_time x batch_size x num_classes)`, les logits. |
séquenceLongueur | Un vecteur contenant des longueurs de séquence, taille `(batch_size)`. |
choix | porte des valeurs d'attributs facultatifs |
Retour
- une nouvelle instance de CtcGreedyDecoder
Sortie publique < TInt64 > decodedIndices ()
Matrice d'indices, taille `(total_decoded_outputs x 2)`, d'un `SparseTensor
Sortie publique < TInt64 > decodedShape ()
Vecteur de forme, taille `(2)`, du SparseTensor décodé. Les valeurs sont : `[batch_size, max_decoded_length]`.
Sortie publique < TInt64 > decodedValues ()
Vecteur de valeurs, taille : `(total_decoded_outputs)`, d'un `SparseTensor
sortie publique <T> logProbability ()
Matrice, taille `(batch_size x 1)`, contenant les probabilités du journal de séquence.
public statique CtcGreedyDecoder.Options mergeRepeated (booléen mergeRepeated)
Paramètres
fusionRépété | Si True, fusionne les classes répétées dans la sortie. |
---|