
Ce document présente tf.estimator , une API TensorFlow de haut niveau. Les estimateurs encapsulent les actions suivantes :

  • Entraînement
  • Évaluation
  • Prédiction
  • Exporter pour servir

TensorFlow implémente plusieurs estimateurs prédéfinis. Les estimateurs personnalisés sont toujours pris en charge, mais principalement en tant que mesure de rétrocompatibilité. Les estimateurs personnalisés ne doivent pas être utilisés pour le nouveau code . Tous les estimateurs, prédéfinis ou personnalisés, sont des classes basées sur la classe tf.estimator.Estimator .

Pour un exemple rapide, essayez les didacticiels Estimator . Pour un aperçu de la conception de l'API, consultez le livre blanc .


pip install -U tensorflow_datasets
import tempfile
import os

import tensorflow as tf
import tensorflow_datasets as tfds


Semblable à un tf.keras.Model , un estimator est une abstraction au niveau du modèle. Le tf.estimator fournit certaines fonctionnalités actuellement encore en développement pour tf.keras . Ceux-ci sont:

  • Formation basée sur le serveur de paramètres
  • Intégration complète de TFX

Capacités des estimateurs

Les estimateurs offrent les avantages suivants :

  • Vous pouvez exécuter des modèles basés sur Estimator sur un hôte local ou sur un environnement multiserveur distribué sans modifier votre modèle. De plus, vous pouvez exécuter des modèles basés sur Estimator sur des CPU, des GPU ou des TPU sans recoder votre modèle.
  • Les estimateurs fournissent une boucle de formation distribuée sécurisée qui contrôle comment et quand :
    • Charger les données
    • Gérer les exceptions
    • Créer des fichiers de point de contrôle et récupérer des échecs
    • Enregistrer les résumés pour TensorBoard

Lors de l'écriture d'une application avec des estimateurs, vous devez séparer le pipeline d'entrée de données du modèle. Cette séparation simplifie les expériences avec différents ensembles de données.

Utilisation d'estimateurs prédéfinis

Les estimateurs prédéfinis vous permettent de travailler à un niveau conceptuel beaucoup plus élevé que les API TensorFlow de base. Vous n'avez plus à vous soucier de la création du graphique ou des sessions de calcul puisque les estimateurs gèrent toute la "plomberie" pour vous. De plus, les estimateurs prédéfinis vous permettent d'expérimenter différentes architectures de modèles en n'apportant que des modifications minimes au code. tf.estimator.DNNClassifier , par exemple, est une classe Estimator prédéfinie qui forme des modèles de classification basés sur des réseaux de neurones denses et à anticipation.

Un programme TensorFlow s'appuyant sur un estimateur prédéfini comprend généralement les quatre étapes suivantes :

1. Ecrire une fonction d'entrée

Par exemple, vous pouvez créer une fonction pour importer l'ensemble d'apprentissage et une autre fonction pour importer l'ensemble de test. Les estimateurs s'attendent à ce que leurs entrées soient formatées comme une paire d'objets :

  • Un dictionnaire dans lequel les clés sont des noms de caractéristiques et les valeurs sont des Tensors (ou SparseTensors) contenant les données de caractéristiques correspondantes
  • Un Tensor contenant un ou plusieurs libellés

L' input_fn doit renvoyer un qui produit des paires dans ce format.

Par exemple, le code suivant crée un à partir du fichier train.csv du jeu de données Titanic :

def train_input_fn():
= tf.keras.utils.get_file("train.csv", "")
, batch_size=32,
= (
return titanic_batches

Le input_fn est exécuté dans un tf.Graph et peut également renvoyer directement une paire (features_dics, labels) contenant des tenseurs de graphe, mais cela est sujet aux erreurs en dehors des cas simples comme le retour de constantes.

2. Définissez les colonnes de fonction.

Chaque tf.feature_column identifie un nom de fonctionnalité, son type et tout prétraitement d'entrée.

Par exemple, l'extrait de code suivant crée trois colonnes de caractéristiques.

  • La première utilise la fonction d' age directement comme entrée à virgule flottante.
  • La seconde utilise la fonction de class comme entrée catégorique.
  • La troisième utilise l' embark_town comme entrée catégorique, mais utilise l' hashing trick pour éviter d'avoir à énumérer les options et à définir le nombre d'options.

Pour plus d'informations, consultez le didacticiel sur les colonnes de fonctions .

age = tf.feature_column.numeric_column('age')
= tf.feature_column.categorical_column_with_vocabulary_list('class', ['First', 'Second', 'Third'])
= tf.feature_column.categorical_column_with_hash_bucket('embark_town', 32)

3. Instanciez l'estimateur prédéfini pertinent.

Par exemple, voici un exemple d'instanciation d'un estimateur préfabriqué nommé LinearClassifier :

model_dir = tempfile.mkdtemp()
= tf.estimator.LinearClassifier(
=[embark, cls, age],
Pour plus d'informations, vous pouvez consulter le didacticiel sur le classificateur linéaire .

4. Appelez une méthode de formation, d'évaluation ou d'inférence.

Tous les estimateurs fournissent des méthodes d' train , d' evaluate et de predict .

model = model.train(input_fn=train_input_fn, steps=100)
result = model.evaluate(train_input_fn, steps=10)

for key, value in result.items():
print(key, ":", value)
for pred in model.predict(train_input_fn):
for key, value in pred.items():
print(key, ":", value)
Avantages des estimateurs préfabriqués

Les estimateurs prédéfinis encodent les meilleures pratiques, offrant les avantages suivants :

  • Meilleures pratiques pour déterminer où les différentes parties du graphe de calcul doivent s'exécuter, en mettant en œuvre des stratégies sur une seule machine ou sur un cluster.
  • Meilleures pratiques pour la rédaction d'événements (résumés) et résumés universellement utiles.

Si vous n'utilisez pas d'estimateurs prédéfinis, vous devez implémenter vous-même les fonctionnalités précédentes.

Estimateurs personnalisés

Le cœur de chaque estimateur, qu'il soit prédéfini ou personnalisé, est sa fonction de modèle , model_fn , qui est une méthode qui crée des graphiques pour la formation, l'évaluation et la prédiction. Lorsque vous utilisez un estimateur prédéfini, quelqu'un d'autre a déjà implémenté la fonction de modèle. Lorsque vous vous appuyez sur un estimateur personnalisé, vous devez écrire vous-même la fonction de modèle.

Créer un estimateur à partir d'un modèle Keras

Vous pouvez convertir des modèles Keras existants en estimateurs avec tf.keras.estimator.model_to_estimator . Ceci est utile si vous souhaitez moderniser le code de votre modèle, mais que votre pipeline de formation nécessite toujours des estimateurs.

Instanciez un modèle Keras MobileNet V2 et compilez le modèle avec l'optimiseur, la perte et les métriques avec lesquels vous entraîner :

keras_mobilenet_v2 = tf.keras.applications.MobileNetV2(
=(160, 160, 3), include_top=False)
.trainable = False

= tf.keras.Sequential([

# Compile the model
Créez un Estimator à partir du modèle Keras compilé. L'état initial du modèle Keras est conservé dans l' Estimator créé :

est_mobilenet_v2 = tf.keras.estimator.model_to_estimator(keras_model=estimator_model)
Traitez l' Estimator dérivé comme vous le feriez avec n'importe quel autre Estimator .

IMG_SIZE = 160  # All images will be resized to 160x160

def preprocess(image, label):
= tf.cast(image, tf.float32)
= (image/127.5) - 1
= tf.image.resize(image, (IMG_SIZE, IMG_SIZE))
return image, label
def train_input_fn(batch_size):
= tfds.load('cats_vs_dogs', as_supervised=True)
= data['train']
return train_data

Pour entraîner, appelez la fonction d'entraînement d'Estimator :

est_mobilenet_v2.train(input_fn=lambda: train_input_fn(32), steps=50)
De même, pour évaluer, appelez la fonction d'évaluation de l'estimateur :

est_mobilenet_v2.evaluate(input_fn=lambda: train_input_fn(32), steps=10)
Pour plus de détails, veuillez vous référer à la documentation de tf.keras.estimator.model_to_estimator .

Enregistrement de points de contrôle basés sur des objets avec Estimator

Les estimateurs enregistrent par défaut les points de contrôle avec des noms de variables plutôt que le graphique d'objets décrit dans le guide des points de contrôle. tf.train.Checkpoint lira les points de contrôle basés sur le nom, mais les noms de variables peuvent changer lors du déplacement de parties d'un modèle en dehors du model_fn de l'Estimator. Pour une compatibilité ascendante, l'enregistrement de points de contrôle basés sur des objets facilite la formation d'un modèle à l'intérieur d'un estimateur, puis son utilisation en dehors de celui-ci.

import tensorflow.compat.v1 as tf_compat
def toy_dataset():
= tf.range(10.)[:, None]
= inputs * 5. + tf.range(5.)[None, :]
(x=inputs, y=labels)).repeat().batch(2)
class Net(tf.keras.Model):
"""A simple linear model."""

def __init__(self):
super(Net, self).__init__()
self.l1 = tf.keras.layers.Dense(5)

def call(self, x):
return self.l1(x)
def model_fn(features, labels, mode):
= Net()
= tf.keras.optimizers.Adam(0.1)
= tf.train.Checkpoint(step=tf_compat.train.get_global_step(),
=opt, net=net)
with tf.GradientTape() as tape:
= net(features['x'])
= tf.reduce_mean(tf.abs(output - features['y']))
= net.trainable_variables
= tape.gradient(loss, variables)
return tf.estimator.EstimatorSpec(
    train_op, variables)),
# Tell the Estimator to save "ckpt" in an object-based format.

= tf.estimator.Estimator(model_fn, './tf_estimator_example/')
.train(toy_dataset, steps=10)
tf.train.Checkpoint peut alors charger les points de contrôle de l'estimateur à partir de son model_dir .

opt = tf.keras.optimizers.Adam(0.1)
= Net()
= tf.train.Checkpoint(
=tf.Variable(1, dtype=tf.int64), optimizer=opt, net=net)
.step.numpy()  # From est.train(..., steps=10)

Modèles enregistrés à partir d'estimateurs

Les estimateurs exportent SavedModels via tf.Estimator.export_saved_model .

input_column = tf.feature_column.numeric_column("x")

= tf.estimator.LinearClassifier(feature_columns=[input_column])

def input_fn():
({"x": [1., 2., 3., 4.]}, [1, 1, 0, 0])).repeat(200).shuffle(64).batch(16)
Vous pouvez également charger et exécuter ce modèle, à partir de python :

imported = tf.saved_model.load(estimator_path)

def predict(x):
= tf.train.Example()
return imported.signatures["predict"](
{'class_ids': <tf.Tensor: shape=(1, 1), dtype=int64, numpy=array([[1]])>, 'classes': <tf.Tensor: shape=(1, 1), dtype=string, numpy=array([[b'1']], dtype=object)>, 'all_classes': <tf.Tensor: shape=(1, 2), dtype=string, numpy=array([[b'0', b'1']], dtype=object)>, 'all_class_ids': <tf.Tensor: shape=(1, 2), dtype=int32, numpy=array([[0, 1]], dtype=int32)>, 'logits': <tf.Tensor: shape=(1, 1), dtype=float32, numpy=array([[0.2974025]], dtype=float32)>, 'logistic': <tf.Tensor: shape=(1, 1), dtype=float32, numpy=array([[0.5738074]], dtype=float32)>, 'probabilities': <tf.Tensor: shape=(1, 2), dtype=float32, numpy=array([[0.42619258, 0.5738074 ]], dtype=float32)>}
{'class_ids': <tf.Tensor: shape=(1, 1), dtype=int64, numpy=array([[0]])>, 'classes': <tf.Tensor: shape=(1, 1), dtype=string, numpy=array([[b'0']], dtype=object)>, 'all_classes': <tf.Tensor: shape=(1, 2), dtype=string, numpy=array([[b'0', b'1']], dtype=object)>, 'all_class_ids': <tf.Tensor: shape=(1, 2), dtype=int32, numpy=array([[0, 1]], dtype=int32)>, 'logits': <tf.Tensor: shape=(1, 1), dtype=float32, numpy=array([[-1.1919093]], dtype=float32)>, 'logistic': <tf.Tensor: shape=(1, 1), dtype=float32, numpy=array([[0.23291764]], dtype=float32)>, 'probabilities': <tf.Tensor: shape=(1, 2), dtype=float32, numpy=array([[0.7670824 , 0.23291762]], dtype=float32)>}

tf.estimator.export.build_raw_serving_input_receiver_fn vous permet de créer des fonctions d'entrée qui prennent des tenseurs bruts plutôt que tf.train.Example s.

Utilisation de tf.distribute.Strategy avec Estimator (support limité)

tf.estimator est une API TensorFlow de formation distribuée qui prenait en charge à l'origine l'approche du serveur de paramètres asynchrone. tf.estimator prend désormais en charge tf.distribute.Strategy . Si vous utilisez tf.estimator , vous pouvez passer à la formation distribuée avec très peu de modifications de votre code. Grâce à cela, les utilisateurs d'Estimator peuvent désormais effectuer une formation distribuée synchrone sur plusieurs GPU et plusieurs travailleurs, ainsi qu'utiliser des TPU. Cette prise en charge dans Estimator est cependant limitée. Consultez la section Ce qui est maintenant pris en charge ci-dessous pour plus de détails.

L'utilisation de tf.distribute.Strategy avec Estimator est légèrement différente de celle de Keras. Au lieu d'utiliser strategy.scope , vous transmettez maintenant l'objet de stratégie dans le RunConfig pour l'Estimator.

Vous pouvez vous référer au guide de formation distribué pour plus d'informations.

Voici un extrait de code qui montre cela avec un Estimator LinearRegressor et MirroredStrategy prédéfinis :

mirrored_strategy = tf.distribute.MirroredStrategy()
= tf.estimator.RunConfig(
=mirrored_strategy, eval_distribute=mirrored_strategy)
= tf.estimator.LinearRegressor(
Ici, vous utilisez un estimateur prédéfini, mais le même code fonctionne également avec un estimateur personnalisé. train_distribute détermine comment la formation sera distribuée et eval_distribute détermine comment l'évaluation sera distribuée. C'est une autre différence avec Keras où vous utilisez la même stratégie pour la formation et l'évaluation.

Vous pouvez maintenant entraîner et évaluer cet estimateur avec une fonction d'entrée :

def input_fn():
={"feats":[1.]}, [1.]))
return dataset.repeat(1000).batch(10)
.train(input_fn=input_fn, steps=10)
.evaluate(input_fn=input_fn, steps=10)
Une autre différence à souligner ici entre Estimator et Keras est la gestion des entrées. Dans Keras, chaque lot de l'ensemble de données est automatiquement réparti entre les multiples répliques. Dans Estimator, cependant, vous n'effectuez pas de fractionnement automatique des lots, ni ne partagez automatiquement les données entre différents travailleurs. Vous avez un contrôle total sur la façon dont vous souhaitez que vos données soient distribuées entre les travailleurs et les appareils, et vous devez fournir un input_fn pour spécifier comment distribuer vos données.

Votre input_fn est appelé une fois par worker, donnant ainsi un jeu de données par worker. Ensuite, un lot de cet ensemble de données est transmis à une réplique sur ce travailleur, consommant ainsi N lots pour N répliques sur 1 travailleur. En d'autres termes, l'ensemble de données renvoyé par input_fn doit fournir des lots de taille PER_REPLICA_BATCH_SIZE . Et la taille de lot globale pour une étape peut être obtenue sous PER_REPLICA_BATCH_SIZE * strategy.num_replicas_in_sync .

Lorsque vous effectuez une formation multi-travailleurs, vous devez soit diviser vos données entre les travailleurs, soit mélanger avec une graine aléatoire sur chacun. Vous pouvez consulter un exemple de la façon de procéder dans le didacticiel Formation multi-travailleurs avec Estimator .

Et de même, vous pouvez également utiliser des stratégies multi-travailleurs et de serveurs de paramètres. Le code reste le même, mais vous devez utiliser tf.estimator.train_and_evaluate et définir les variables d'environnement TF_CONFIG pour chaque binaire exécuté dans votre cluster.

Qu'est-ce qui est pris en charge maintenant ?

La prise en charge de l'entraînement avec Estimator à l'aide de toutes les stratégies à l'exception de TPUStrategy est limitée. La formation et l'évaluation de base devraient fonctionner, mais un certain nombre de fonctionnalités avancées telles que v1.train.Scaffold ne fonctionnent pas. Il peut également y avoir un certain nombre de bogues dans cette intégration et il n'est pas prévu d'améliorer activement cette prise en charge (l'accent est mis sur Keras et la prise en charge de la boucle d'entraînement personnalisée). Si possible, vous devriez préférer utiliser tf.distribute avec ces API à la place.

API de formation Stratégie en miroir TPUStratégie MultiWorkerMirroredStrategy Stratégie de stockage central ParameterServerStrategy
API d'estimation Assistance limitée Non supporté Assistance limitée Assistance limitée Assistance limitée

Exemples et tutoriels

Voici quelques exemples de bout en bout qui montrent comment utiliser diverses stratégies avec Estimator :

  1. Le didacticiel Formation multi-travailleurs avec Estimator montre comment vous pouvez vous entraîner avec plusieurs travailleurs à l'aide de MultiWorkerMirroredStrategy sur le jeu de données MNIST.
  2. Un exemple de bout en bout d' exécution d'une formation multi-travailleurs avec des stratégies de distribution dans tensorflow/ecosystem à l'aide de modèles Kubernetes. Il commence par un modèle Keras et le convertit en estimateur à l'aide de l'API tf.keras.estimator.model_to_estimator .
  3. Le modèle ResNet50 officiel, qui peut être entraîné à l'aide de MirroredStrategy ou MultiWorkerMirroredStrategy .