
Este documento presenta tf.estimator , una API de TensorFlow de alto nivel. Los estimadores encapsulan las siguientes acciones:

  • Capacitación
  • Evaluación
  • Predicción
  • Exportar para servir

TensorFlow implementa varios estimadores prefabricados. Los estimadores personalizados aún se admiten, pero principalmente como una medida de compatibilidad con versiones anteriores. Los estimadores personalizados no deben usarse para el código nuevo . Todos los Estimadores (prefabricados o personalizados) son clases basadas en la clase tf.estimator.Estimator .

Para ver un ejemplo rápido, pruebe los tutoriales de Estimator . Para obtener una descripción general del diseño de la API, consulte el documento técnico .


pip install -U tensorflow_datasets
import tempfile
import os

import tensorflow as tf
import tensorflow_datasets as tfds


Similar a tf.keras.Model , un estimator es una abstracción a nivel de modelo. El tf.estimator proporciona algunas capacidades que aún están en desarrollo para tf.keras . Estos son:

  • Entrenamiento basado en servidor de parámetros
  • Integración completa de TFX

Capacidades de los estimadores

Los estimadores proporcionan los siguientes beneficios:

  • Puede ejecutar modelos basados ​​en Estimator en un host local o en un entorno distribuido de varios servidores sin cambiar su modelo. Además, puede ejecutar modelos basados ​​en Estimator en CPU, GPU o TPU sin volver a codificar su modelo.
  • Los estimadores proporcionan un ciclo de entrenamiento distribuido seguro que controla cómo y cuándo:
    • Cargar datos
    • Manejar excepciones
    • Cree archivos de puntos de control y recupérese de fallas
    • Guardar resúmenes para TensorBoard

Al escribir una aplicación con estimadores, debe separar la canalización de entrada de datos del modelo. Esta separación simplifica los experimentos con diferentes conjuntos de datos.

Uso de estimadores prefabricados

Los estimadores prefabricados le permiten trabajar a un nivel conceptual mucho más alto que las API básicas de TensorFlow. Ya no tiene que preocuparse por crear el gráfico computacional o las sesiones, ya que Estimators maneja toda la "plomería" por usted. Además, los Estimadores prefabricados le permiten experimentar con diferentes arquitecturas de modelos realizando solo cambios mínimos en el código. tf.estimator.DNNClassifier , por ejemplo, es una clase de Estimator prefabricada que entrena modelos de clasificación basados ​​en redes neuronales densas y realimentadas.

Un programa de TensorFlow que se basa en un Estimator prefabricado generalmente consta de los siguientes cuatro pasos:

1. Escribe una función de entrada

Por ejemplo, puede crear una función para importar el conjunto de entrenamiento y otra función para importar el conjunto de prueba. Los estimadores esperan que sus entradas tengan el formato de un par de objetos:

  • Un diccionario en el que las claves son nombres de funciones y los valores son tensores (o SparseTensors) que contienen los datos de funciones correspondientes
  • Un tensor que contiene una o más etiquetas

El input_fn debe devolver un que produce pares en ese formato.

Por ejemplo, el siguiente código crea un a partir del archivo train.csv del conjunto de datos del Titanic:

def train_input_fn():
= tf.keras.utils.get_file("train.csv", "")
, batch_size=32,
= (
return titanic_batches

El input_fn se ejecuta en un tf.Graph y también puede devolver directamente un par (features_dics, labels) que contiene tensores gráficos, pero esto es propenso a errores fuera de casos simples como devolver constantes.

2. Defina las columnas de características.

Cada tf.feature_column identifica un nombre de característica, su tipo y cualquier preprocesamiento de entrada.

Por ejemplo, el siguiente fragmento crea tres columnas de características.

  • El primero usa la función de age directamente como una entrada de punto flotante.
  • El segundo usa la función de class como una entrada categórica.
  • El tercero utiliza la embark_town como una entrada categórica, pero utiliza el hashing trick para evitar la necesidad de enumerar las opciones y establecer el número de opciones.

Para obtener más información, consulte el tutorial de columnas de características .

age = tf.feature_column.numeric_column('age')
= tf.feature_column.categorical_column_with_vocabulary_list('class', ['First', 'Second', 'Third'])
= tf.feature_column.categorical_column_with_hash_bucket('embark_town', 32)

3. Cree una instancia del Estimador prefabricado relevante.

Por ejemplo, aquí hay una instancia de muestra de un Estimador prefabricado llamado LinearClassifier :

model_dir = tempfile.mkdtemp()
= tf.estimator.LinearClassifier(
=[embark, cls, age],
INFO:tensorflow:Using default config.
Para más información, puedes ir al tutorial del clasificador lineal .

4. Llame a un método de entrenamiento, evaluación o inferencia.

Todos los estimadores proporcionan métodos de train , evaluate y predict .

model = model.train(input_fn=train_input_fn, steps=100)
result = model.evaluate(train_input_fn, steps=10)

for key, value in result.items():
print(key, ":", value)
for pred in model.predict(train_input_fn):
for key, value in pred.items():
print(key, ":", value)
Beneficios de los estimadores prefabricados

Los estimadores prefabricados codifican las mejores prácticas y brindan los siguientes beneficios:

  • Las mejores prácticas para determinar dónde deben ejecutarse las diferentes partes del gráfico computacional, implementando estrategias en una sola máquina o en un clúster.
  • Las mejores prácticas para la redacción de eventos (resumen) y resúmenes universalmente útiles.

Si no usa Estimadores prefabricados, debe implementar las funciones anteriores usted mismo.

Estimadores personalizados

El corazón de cada Estimator, ya sea prefabricado o personalizado, es su función de modelo , model_fn , que es un método que crea gráficos para entrenamiento, evaluación y predicción. Cuando está utilizando un Estimador prefabricado, alguien más ya ha implementado la función de modelo. Cuando confíe en un Estimador personalizado, debe escribir la función del modelo usted mismo.

Crear un Estimador a partir de un modelo de Keras

Puede convertir modelos Keras existentes en Estimadores con tf.keras.estimator.model_to_estimator . Esto es útil si desea modernizar el código de su modelo, pero su proceso de capacitación aún requiere Estimadores.

Crea una instancia de un modelo Keras MobileNet V2 y compila el modelo con el optimizador, la pérdida y las métricas para entrenar con:

keras_mobilenet_v2 = tf.keras.applications.MobileNetV2(
=(160, 160, 3), include_top=False)
.trainable = False

= tf.keras.Sequential([

# Compile the model
Cree un Estimator a partir del modelo de Keras compilado. El estado del modelo inicial del modelo Keras se conserva en el Estimator creado:

est_mobilenet_v2 = tf.keras.estimator.model_to_estimator(keras_model=estimator_model)
INFO:tensorflow:Using default config.
Trate el Estimator derivado como lo haría con cualquier otro Estimator .

IMG_SIZE = 160  # All images will be resized to 160x160

def preprocess(image, label):
= tf.cast(image, tf.float32)
= (image/127.5) - 1
= tf.image.resize(image, (IMG_SIZE, IMG_SIZE))
return image, label
def train_input_fn(batch_size):
= tfds.load('cats_vs_dogs', as_supervised=True)
= data['train']
return train_data

Para entrenar, llama a la función de tren de Estimator:

est_mobilenet_v2.train(input_fn=lambda: train_input_fn(32), steps=50)
De manera similar, para evaluar, llame a la función de evaluación del Estimador:

est_mobilenet_v2.evaluate(input_fn=lambda: train_input_fn(32), steps=10)
Para obtener más detalles, consulte la documentación de tf.keras.estimator.model_to_estimator .

Guardar puntos de control basados ​​en objetos con Estimator

Los estimadores guardan de forma predeterminada los puntos de control con nombres de variables en lugar del gráfico de objetos descrito en la guía de puntos de control . tf.train.Checkpoint leerá los puntos de control basados ​​en nombres, pero los nombres de las variables pueden cambiar al mover partes de un modelo fuera del model_fn del Estimator. Para la compatibilidad futura, guardar los puntos de control basados ​​en objetos hace que sea más fácil entrenar un modelo dentro de un Estimator y luego usarlo fuera de uno.

import tensorflow.compat.v1 as tf_compat
def toy_dataset():
= tf.range(10.)[:, None]
= inputs * 5. + tf.range(5.)[None, :]
(x=inputs, y=labels)).repeat().batch(2)
class Net(tf.keras.Model):
"""A simple linear model."""

def __init__(self):
super(Net, self).__init__()
self.l1 = tf.keras.layers.Dense(5)

def call(self, x):
return self.l1(x)
def model_fn(features, labels, mode):
= Net()
= tf.keras.optimizers.Adam(0.1)
= tf.train.Checkpoint(step=tf_compat.train.get_global_step(),
=opt, net=net)
with tf.GradientTape() as tape:
= net(features['x'])
= tf.reduce_mean(tf.abs(output - features['y']))
= net.trainable_variables
= tape.gradient(loss, variables)
return tf.estimator.EstimatorSpec(
    train_op, variables)),
# Tell the Estimator to save "ckpt" in an object-based format.

= tf.estimator.Estimator(model_fn, './tf_estimator_example/')
.train(toy_dataset, steps=10)
tf.train.Checkpoint puede cargar los puntos de control del Estimator desde su model_dir .

opt = tf.keras.optimizers.Adam(0.1)
= Net()
= tf.train.Checkpoint(
=tf.Variable(1, dtype=tf.int64), optimizer=opt, net=net)
.step.numpy()  # From est.train(..., steps=10)

Modelos guardados de Estimadores

Los estimadores exportan modelos guardados a través tf.Estimator.export_saved_model .

input_column = tf.feature_column.numeric_column("x")

= tf.estimator.LinearClassifier(feature_columns=[input_column])

def input_fn():
.train(input_fn, steps=100)
INFO:tensorflow:Using default config.
También puede cargar y ejecutar ese modelo, desde python:

imported = tf.saved_model.load(estimator_path)

def predict(x):
= tf.train.Example()
return imported.signatures["predict"](
{'class_ids': <tf.Tensor: shape=(1, 1), dtype=int64, numpy=array([[1]])>, 'classes': <tf.Tensor: shape=(1, 1), dtype=string, numpy=array([[b'1']], dtype=object)>, 'all_classes': <tf.Tensor: shape=(1, 2), dtype=string, numpy=array([[b'0', b'1']], dtype=object)>, 'all_class_ids': <tf.Tensor: shape=(1, 2), dtype=int32, numpy=array([[0, 1]], dtype=int32)>, 'logits': <tf.Tensor: shape=(1, 1), dtype=float32, numpy=array([[0.2974025]], dtype=float32)>, 'logistic': <tf.Tensor: shape=(1, 1), dtype=float32, numpy=array([[0.5738074]], dtype=float32)>, 'probabilities': <tf.Tensor: shape=(1, 2), dtype=float32, numpy=array([[0.42619258, 0.5738074 ]], dtype=float32)>}
{'class_ids': <tf.Tensor: shape=(1, 1), dtype=int64, numpy=array([[0]])>, 'classes': <tf.Tensor: shape=(1, 1), dtype=string, numpy=array([[b'0']], dtype=object)>, 'all_classes': <tf.Tensor: shape=(1, 2), dtype=string, numpy=array([[b'0', b'1']], dtype=object)>, 'all_class_ids': <tf.Tensor: shape=(1, 2), dtype=int32, numpy=array([[0, 1]], dtype=int32)>, 'logits': <tf.Tensor: shape=(1, 1), dtype=float32, numpy=array([[-1.1919093]], dtype=float32)>, 'logistic': <tf.Tensor: shape=(1, 1), dtype=float32, numpy=array([[0.23291764]], dtype=float32)>, 'probabilities': <tf.Tensor: shape=(1, 2), dtype=float32, numpy=array([[0.7670824 , 0.23291762]], dtype=float32)>}

tf.estimator.export.build_raw_serving_input_receiver_fn le permite crear funciones de entrada que toman tensores sin procesar en lugar de tf.train.Example s.

Uso de tf.distribute.Strategy con Estimator (soporte limitado)

tf.estimator es una API de TensorFlow de capacitación distribuida que originalmente admitía el enfoque del servidor de parámetros asincrónicos. tf.estimator ahora es compatible con tf.distribute.Strategy . Si usa tf.estimator , puede cambiar al entrenamiento distribuido con muy pocos cambios en su código. Con esto, los usuarios de Estimator ahora pueden realizar capacitación distribuida sincrónica en múltiples GPU y múltiples trabajadores, así como usar TPU. Este soporte en Estimator es, sin embargo, limitado. Consulte la sección Qué es compatible ahora a continuación para obtener más detalles.

Usar tf.distribute.Strategy con Estimator es ligeramente diferente que en el caso de Keras. En lugar de usar strategy.scope , ahora pasa el objeto de estrategia a RunConfig para el Estimador.

Puede consultar la guía de capacitación distribuida para obtener más información.

Aquí hay un fragmento de código que muestra esto con un Estimator LinearRegressor y MirroredStrategy prefabricados:

mirrored_strategy = tf.distribute.MirroredStrategy()
= tf.estimator.RunConfig(
=mirrored_strategy, eval_distribute=mirrored_strategy)
= tf.estimator.LinearRegressor(
.train(input_fn=input_fn, steps=10)
Otra diferencia a destacar aquí entre Estimator y Keras es el manejo de entrada. En Keras, cada lote del conjunto de datos se divide automáticamente en múltiples réplicas. En Estimator, sin embargo, no realiza la división automática de lotes ni fragmenta automáticamente los datos entre diferentes trabajadores. Tiene control total sobre cómo desea que se distribuyan sus datos entre trabajadores y dispositivos, y debe proporcionar un input_fn para especificar cómo distribuir sus datos.

Su input_fn se llama una vez por trabajador, lo que proporciona un conjunto de datos por trabajador. Luego, un lote de ese conjunto de datos se alimenta a una réplica en ese trabajador, por lo que consume N lotes para N réplicas en 1 trabajador. En otras palabras, el conjunto de datos devuelto por input_fn debe proporcionar lotes de tamaño PER_REPLICA_BATCH_SIZE . Y el tamaño de lote global para un paso se puede obtener como PER_REPLICA_BATCH_SIZE * strategy.num_replicas_in_sync .

Al realizar la capacitación de varios trabajadores, debe dividir los datos entre los trabajadores o mezclar con una semilla aleatoria en cada uno. Puedes consultar un ejemplo de cómo hacerlo en el tutorial Formación multitrabajador con Estimator .

Y de manera similar, también puede usar estrategias de servidores de parámetros y trabajadores múltiples. El código sigue siendo el mismo, pero debe usar tf.estimator.train_and_evaluate y establecer variables de entorno TF_CONFIG para cada binario que se ejecuta en su clúster.

¿Qué es compatible ahora?

Hay soporte limitado para el entrenamiento con Estimator usando todas las estrategias excepto TPUStrategy . La capacitación básica y la evaluación deberían funcionar, pero una serie de características avanzadas como v1.train.Scaffold no lo hacen. También puede haber una serie de errores en esta integración y no hay planes para mejorar activamente este soporte (el enfoque está en Keras y el soporte de bucle de entrenamiento personalizado). Si es posible, debería preferir usar tf.distribute con esas API en su lugar.

API de entrenamiento Estrategia reflejada TPUEstrategia MultiWorkerMirroredStrategy Estrategia de almacenamiento central ParámetroServidorEstrategia
API del estimador Soporte limitado No soportado Soporte limitado Soporte limitado Soporte limitado

Ejemplos y tutoriales

Aquí hay algunos ejemplos completos que muestran cómo usar varias estrategias con Estimator:

  1. El tutorial Capacitación de varios trabajadores con Estimator muestra cómo puede capacitarse con varios trabajadores mediante MultiWorkerMirroredStrategy en el conjunto de datos MNIST.
  2. Un ejemplo integral de ejecución de capacitación para varios trabajadores con estrategias de distribución en tensorflow/ecosystem utilizando plantillas de Kubernetes. Comienza con un modelo Keras y lo convierte en un Estimator utilizando la API tf.keras.estimator.model_to_estimator .
  3. El modelo oficial de ResNet50 , que se puede entrenar con MirroredStrategy o MultiWorkerMirroredStrategy .