Dataset

classe abstraite publique
Sous-classes directes connues

Représente une liste potentiellement longue d’éléments indépendants (échantillons) et permet d’effectuer des itérations et des transformations sur ces éléments.

Constructeurs Publics

Ensemble de données (Ops tf, variante Operand <?>, List<Class<? extends TType >> outputTypes, List< Shape > outputShapes)

Méthodes publiques

Ensemble de données final
batch (long batchSize, booléen dropLastBatch)
Regroupe les éléments de cet ensemble de données en lots.
Ensemble de données final
lot (taille de lot longue)
Regroupe les éléments de cet ensemble de données en lots.
Ensemble de données statique
fromTensorSlices (Ops tf, List< Operand <?>> tenseurs, List<Class<? extends TType >> outputTypes)
Crée un « Dataset » en mémoire dont les éléments sont des tranches des tenseurs donnés.
Opérations
Liste< Forme >
getOutputShapes ()
Obtenez une liste de formes pour chaque composant de cet ensemble de données.
Liste<Class<? étend TType >>
getOutputTypes ()
Obtenez une liste des types de sortie pour chaque composant de cet ensemble de données.
Opérande <?>
getVariant ()
Obtenez le tenseur de variantes représentant cet ensemble de données.
Itérateur<Liste< Opérande <?>>>
itérateur ()
Crée un itérateur qui parcourt tous les lots de cet ensemble de données de manière impatiente.
Itérateur d'ensemble de données
makeInitializeableIterator ()
Crée un « DatasetIterator » qui peut être utilisé pour parcourir les éléments de cet ensemble de données.
Itérateur d'ensemble de données
makeOneShotIterator ()
Crée un « DatasetIterator » qui peut être utilisé pour parcourir les éléments de cet ensemble de données.
Base de données
map (Function<List< Operand <?>>, List< Operand <?>>> mappeur)
Renvoie un nouveau Dataset qui mappe une fonction sur tous les éléments renvoyés par cet ensemble de données.
Base de données
mapAllComponents (Fonction < Opérande <?>, Opérande <?>> mappeur)
Renvoie un nouveau Dataset qui mappe une fonction sur tous les éléments de cet ensemble de données, sur tous les composants de chaque élément.
Base de données
mapOneComponent (index int, Function< Operand <?>, Operand <?>> mappeur)
Renvoie un nouveau Dataset qui mappe une fonction sur tous les éléments de cet ensemble de données, sur un seul composant de chaque élément.
Ensemble de données final
sauter (compte long)
Renvoie un nouveau « Dataset » qui ignore les éléments initiaux « count » de cet ensemble de données
Ensemble de données final
prendre (compte long)
Renvoie un nouveau « Dataset » avec uniquement les premiers éléments « count » de cet ensemble de données.
Ensemble de données statique
textLineDataset (Ops tf, nom de fichier String, String compressionType, long bufferSize)
Ensemble de données statique
tfRecordDataset (Ops tf, nom de fichier String, String compressionType, long bufferSize)
Chaîne

Méthodes héritées

Constructeurs Publics

Ensemble de données public (Ops tf, variante Operand <?>, List<Class<? extends TType >> outputTypes, List< Shape > outputShapes)

Méthodes publiques

lot de données final public (long batchSize, booléen dropLastBatch)

Regroupe les éléments de cet ensemble de données en lots.

Paramètres
taille du lot Le nombre d'éléments souhaités par lot
déposer le dernier lot S'il faut laisser de côté le lot final s'il contient moins d'éléments `batchSize`.
Retour
  • Un ensemble de données par lots

lot de données final public (long batchSize)

Regroupe les éléments de cet ensemble de données en lots. Inclut le dernier lot, même s'il contient moins d'éléments `batchSize`.

Paramètres
taille du lot Le nombre d'éléments souhaités par lot
Retour
  • Un ensemble de données par lots

Ensemble de données statique public fromTensorSlices (Ops tf, List< Operand <?>> tensors, List<Class<? extends TType >> outputTypes)

Crée un « Dataset » en mémoire dont les éléments sont des tranches des tenseurs donnés. Chaque élément de cet ensemble de données sera un List<Operand<?>> , représentant des tranches (par exemple des lots) des tenseurs fournis.

Paramètres
tf Accesseur d'opérations
tenseurs Une liste d' Operand<?> représentant les composants de cet ensemble de données (par exemple, fonctionnalités, étiquettes)
Types de sortie Une liste de classes de types tenseurs représentant le type de données de chaque composant de cet ensemble de données.
Retour
  • Un nouveau « ensemble de données »

Opérations publiques getOpsInstance ()

liste publique < Forme > getOutputShapes ()

Obtenez une liste de formes pour chaque composant de cet ensemble de données.

Liste publique<Class<? étend TType >> getOutputTypes ()

Obtenez une liste des types de sortie pour chaque composant de cet ensemble de données.

Opérande public <?> getVariant ()

Obtenez le tenseur de variantes représentant cet ensemble de données.

public Iterator<List< Operand <?>>> itérateur ()

Crée un itérateur qui parcourt tous les lots de cet ensemble de données de manière impatiente. Chaque lot est une liste de composants, renvoyés sous forme d'objets « Sortie ».

Cette méthode permet pour chaque itération de lots lors de l'exécution en mode impatient. Pour l'itération par lots en mode graphique, voir `makeOneShotIterator`.

Retour
  • un itérateur à travers des lots de cet ensemble de données.

public DatasetIterator makeInitializeableIterator ()

Crée un « DatasetIterator » qui peut être utilisé pour parcourir les éléments de cet ensemble de données.

Cet itérateur devra être initialisé avec un appel à `iterator.makeInitializer(Dataset)` avant que les éléments puissent être récupérés dans une boucle.

Retour
  • Un nouveau `DatasetIterator` basé sur la structure de cet ensemble de données.

public DatasetIterator makeOneShotIterator ()

Crée un « DatasetIterator » qui peut être utilisé pour parcourir les éléments de cet ensemble de données. L'utilisation de `makeOneShotIterator` garantit que l'itérateur est automatiquement initialisé sur cet ensemble de données. saute En mode graphique, l'opération d'initialisation sera ajoutée à la liste d'initialisation du graphique, qui doit être exécutée via `tf.init()` :

Ex :

     try (Session session = new Session(graph) {
         // Immediately run initializers
         session.run(tf.init());
     }
 

En mode impatient, l'initialiseur sera exécuté automatiquement à la suite de cet appel.

Retour
  • Un nouveau `DatasetIterator` basé sur la structure de cet ensemble de données.

Carte d'ensemble de données publique (Mappeur Function<List< Operand <?>>, List< Operand <?>>>)

Renvoie un nouveau Dataset qui mappe une fonction sur tous les éléments renvoyés par cet ensemble de données.

Par exemple, supposons que chaque élément soit un List<Operand<?>> avec 2 composants : (fonctionnalités, étiquettes).

L'appel de

dataset.map(components -> {
      Operand<?> features = components.get(0);
      Operand<?> labels   = components.get(1);

      return Arrays.asList(
        tf.math.mul(features, tf.constant(2)),
        tf.math.mul(labels, tf.constant(5))
      );
 );
 }
mappera la fonction sur les composants "features" et "labels", en multipliant les fonctionnalités par 2 et en multipliant les étiquettes par 5.

Paramètres
mappeur La fonction à appliquer à chaque élément de cet itérateur.
Retour
  • Un nouvel ensemble de données appliquant `mapper` à chaque élément de cet itérateur.

ensemble de données public mapAllComponents (fonction < opérande <?>, opérande <?>> mappeur)

Renvoie un nouveau Dataset qui mappe une fonction sur tous les éléments de cet ensemble de données, sur tous les composants de chaque élément.

Par exemple, supposons que chaque élément soit un List<Operand<?>> avec 2 composants : (fonctionnalités, étiquettes).

L'appel dataset.mapAllComponents(component -> tf.math.mul(component, tf.constant(2))) mappera la fonction sur les composants `features` et `labels` de chaque élément, en les multipliant tous par 2

Paramètres
mappeur La fonction à appliquer à chaque composant
Retour
  • Un nouvel ensemble de données appliquant « mapper » à tous les composants de chaque élément.

Ensemble de données public mapOneComponent (index int, Function< Operand <?>, Operand <?>> mapper)

Renvoie un nouveau Dataset qui mappe une fonction sur tous les éléments de cet ensemble de données, sur un seul composant de chaque élément.

Par exemple, supposons que chaque élément soit un List<Operand<?>> avec 2 composants : (fonctionnalités, étiquettes).

L'appel dataset.mapOneComponent(0, features -> tf.math.mul(features, tf.constant(2))) mappera la fonction sur le composant `features` de chaque élément, en multipliant chacun par 2.

Paramètres
indice L'index du composant à transformer.
mappeur La fonction à appliquer au composant cible.
Retour
  • Un nouvel ensemble de données appliquant « mapper » au composant à l'index choisi.

Saut de l'ensemble de données final public (compte long)

Renvoie un nouveau « Dataset » qui ignore les éléments initiaux « count » de cet ensemble de données

Paramètres
compter Le nombre d'éléments à « ignorer » pour former le nouvel ensemble de données.
Retour
  • Un nouvel ensemble de données avec les éléments « count » supprimés.

Prise de données finale publique (compte long)

Renvoie un nouveau « Dataset » avec uniquement les premiers éléments « count » de cet ensemble de données.

Paramètres
compter Le nombre d'éléments à "prendre" de cet ensemble de données.
Retour
  • Un nouvel ensemble de données contenant les premiers éléments « count » de cet ensemble de données.

Ensemble de données statique public textLineDataset (Ops tf, nom de fichier chaîne, type de compression de chaîne, taille de tampon longue)

Ensemble de données statique public tfRecordDataset (Ops tf, nom de fichier String, String compressionType, long bufferSize)

chaîne publique versString ()