
Este documento apresenta tf.estimator — uma API TensorFlow de alto nível. Os estimadores encapsulam as seguintes ações:

  • Treinamento
  • Avaliação
  • Predição
  • Exportar para veiculação

O TensorFlow implementa vários estimadores pré-fabricados. Os estimadores personalizados ainda são suportados, mas principalmente como medida de compatibilidade com versões anteriores. Os estimadores personalizados não devem ser usados ​​para novos códigos . Todos os Estimadores – pré-fabricados ou personalizados – são classes baseadas na classe tf.estimator.Estimator .

Para um exemplo rápido, experimente os tutoriais do Estimator . Para obter uma visão geral do design da API, consulte o white paper .


pip install -U tensorflow_datasets
import tempfile
import os

import tensorflow as tf
import tensorflow_datasets as tfds


Semelhante a um tf.keras.Model , um estimator é uma abstração em nível de modelo. O tf.estimator fornece alguns recursos ainda em desenvolvimento para tf.keras . Estes são:

  • Treinamento baseado em servidor de parâmetros
  • Integração completa de TFX

Capacidades dos Estimadores

Os estimadores fornecem os seguintes benefícios:

  • Você pode executar modelos baseados em Estimator em um host local ou em um ambiente multi-servidor distribuído sem alterar seu modelo. Além disso, você pode executar modelos baseados em Estimator em CPUs, GPUs ou TPUs sem recodificar seu modelo.
  • Os estimadores fornecem um loop de treinamento distribuído seguro que controla como e quando:
    • Carregar dados
    • Lidar com exceções
    • Crie arquivos de ponto de verificação e recupere-se de falhas
    • Salvar resumos para o TensorBoard

Ao escrever um aplicativo com estimadores, você deve separar o pipeline de entrada de dados do modelo. Essa separação simplifica os experimentos com diferentes conjuntos de dados.

Usando estimadores pré-fabricados

Os estimadores pré-fabricados permitem que você trabalhe em um nível conceitual muito mais alto do que as APIs básicas do TensorFlow. Você não precisa mais se preocupar em criar o gráfico computacional ou as sessões, pois os Avaliadores tratam de todo o "encanamento" para você. Além disso, os estimadores pré-fabricados permitem que você experimente diferentes arquiteturas de modelo fazendo apenas alterações mínimas no código. tf.estimator.DNNClassifier , por exemplo, é uma classe Estimator pré-criada que treina modelos de classificação baseados em redes neurais densas e feed-forward.

Um programa TensorFlow baseado em um estimador pré-fabricado geralmente consiste nas quatro etapas a seguir:

1. Escreva uma função de entrada

Por exemplo, você pode criar uma função para importar o conjunto de treinamento e outra função para importar o conjunto de teste. Os estimadores esperam que suas entradas sejam formatadas como um par de objetos:

  • Um dicionário no qual as chaves são nomes de recursos e os valores são Tensores (ou SparseTensors) contendo os dados de recursos correspondentes
  • Um tensor contendo um ou mais rótulos

O input_fn deve retornar um que produz pares nesse formato.

Por exemplo, o código a seguir cria um do arquivo train.csv do conjunto de dados do Titanic:

def train_input_fn():
= tf.keras.utils.get_file("train.csv", "")
, batch_size=32,
= (
return titanic_batches

O input_fn é executado em um tf.Graph e também pode retornar diretamente um par (features_dics, labels) contendo tensores de gráfico, mas isso é propenso a erros fora de casos simples, como constantes de retorno.

2. Defina as colunas do recurso.

Cada tf.feature_column identifica um nome de recurso, seu tipo e qualquer pré-processamento de entrada.

Por exemplo, o snippet a seguir cria três colunas de recursos.

  • O primeiro usa o recurso de age diretamente como uma entrada de ponto flutuante.
  • O segundo usa o recurso de class como entrada categórica.
  • O terceiro usa o embark_town como entrada categórica, mas usa o hashing trick para evitar a necessidade de enumerar as opções e definir o número de opções.

Para obter mais informações, consulte o tutorial de colunas de recursos .

age = tf.feature_column.numeric_column('age')
= tf.feature_column.categorical_column_with_vocabulary_list('class', ['First', 'Second', 'Third'])
= tf.feature_column.categorical_column_with_hash_bucket('embark_town', 32)

3. Instancie o estimador pré-fabricado relevante.

Por exemplo, aqui está um exemplo de instanciação de um Estimator pré-fabricado chamado LinearClassifier :

model_dir = tempfile.mkdtemp()
= tf.estimator.LinearClassifier(
=[embark, cls, age],
result = model.evaluate(train_input_fn, steps=10)

for key, value in result.items():
print(key, ":", value)
for pred in model.predict(train_input_fn):
for key, value in pred.items():
print(key, ":", value)
Benefícios dos Avaliadores pré-fabricados

Avaliadores pré-fabricados codificam as melhores práticas, oferecendo os seguintes benefícios:

  • Práticas recomendadas para determinar onde diferentes partes do gráfico computacional devem ser executadas, implementando estratégias em uma única máquina ou em um cluster.
  • Práticas recomendadas para redação de eventos (resumo) e resumos universalmente úteis.

Se você não usa Avaliadores pré-fabricados, você mesmo deve implementar os recursos anteriores.

Estimadores personalizados

O coração de cada Estimador - seja pré-fabricado ou personalizado - é sua função de modelo , model_fn , que é um método que cria gráficos para treinamento, avaliação e previsão. Quando você está usando um estimador pré-fabricado, alguém já implementou a função de modelo. Ao confiar em um estimador personalizado, você mesmo deve escrever a função de modelo.

Criar um estimador de um modelo Keras

Você pode converter modelos Keras existentes em estimadores com tf.keras.estimator.model_to_estimator . Isso é útil se você deseja modernizar seu código de modelo, mas seu pipeline de treinamento ainda requer estimadores.

Instancie um modelo Keras MobileNet V2 e compile o modelo com o otimizador, a perda e as métricas para treinar:

keras_mobilenet_v2 = tf.keras.applications.MobileNetV2(
=(160, 160, 3), include_top=False)
.trainable = False

= tf.keras.Sequential([

# Compile the model
Crie um Estimator a partir do modelo Keras compilado. O estado inicial do modelo Keras é preservado no Estimator criado:

est_mobilenet_v2 = tf.keras.estimator.model_to_estimator(keras_model=estimator_model)
Trate o Estimator derivado como faria com qualquer outro Estimator .

IMG_SIZE = 160  # All images will be resized to 160x160

def preprocess(image, label):
= tf.cast(image, tf.float32)
= (image/127.5) - 1
= tf.image.resize(image, (IMG_SIZE, IMG_SIZE))
return image, label
def train_input_fn(batch_size):
= tfds.load('cats_vs_dogs', as_supervised=True)
= data['train']
return train_data

Para treinar, chame a função train do Estimator:

est_mobilenet_v2.train(input_fn=lambda: train_input_fn(32), steps=50)
Da mesma forma, para avaliar, chame a função de avaliação do Estimador:

est_mobilenet_v2.evaluate(input_fn=lambda: train_input_fn(32), steps=10)
Para obter mais detalhes, consulte a documentação de tf.keras.estimator.model_to_estimator .

Salvando pontos de verificação baseados em objetos com o Estimator

Os estimadores, por padrão, salvam pontos de verificação com nomes de variáveis ​​em vez do gráfico de objeto descrito no guia Ponto de verificação. tf.train.Checkpoint lerá pontos de verificação baseados em nome, mas os nomes das variáveis ​​podem mudar ao mover partes de um modelo para fora do model_fn do Estimador. Para compatibilidade direta, salvar pontos de verificação baseados em objetos facilita o treinamento de um modelo dentro de um estimador e, em seguida, usá-lo fora de um.

import tensorflow.compat.v1 as tf_compat
def toy_dataset():
= tf.range(10.)[:, None]
= inputs * 5. + tf.range(5.)[None, :]
(x=inputs, y=labels)).repeat().batch(2)
class Net(tf.keras.Model):
"""A simple linear model."""

def __init__(self):
super(Net, self).__init__()
self.l1 = tf.keras.layers.Dense(5)

def call(self, x):
return self.l1(x)
def model_fn(features, labels, mode):
= Net()
= tf.keras.optimizers.Adam(0.1)
= tf.train.Checkpoint(step=tf_compat.train.get_global_step(),
=opt, net=net)
with tf.GradientTape() as tape:
= net(features['x'])
= tf.reduce_mean(tf.abs(output - features['y']))
= net.trainable_variables
= tape.gradient(loss, variables)
return tf.estimator.EstimatorSpec(
    train_op, variables)),
# Tell the Estimator to save "ckpt" in an object-based format.

= tf.estimator.Estimator(model_fn, './tf_estimator_example/')
.train(toy_dataset, steps=10)
tf.train.Checkpoint pode então carregar os checkpoints do Estimator de seu model_dir .

opt = tf.keras.optimizers.Adam(0.1)
= Net()
= tf.train.Checkpoint(
=tf.Variable(1, dtype=tf.int64), optimizer=opt, net=net)
.step.numpy()  # From est.train(..., steps=10)

SavedModels de estimadores

Os estimadores exportam SavedModels por meio de tf.Estimator.export_saved_model .

input_column = tf.feature_column.numeric_column("x")

= tf.estimator.LinearClassifier(feature_columns=[input_column])

def input_fn():
({"x": [1., 2., 3., 4.]}, [1, 1, 0, 0])).repeat(200).shuffle(64).batch(16)
Para salvar um Estimator você precisa criar um serving_input_receiver . Essa função cria uma parte de um tf.Graph que analisa os dados brutos recebidos pelo SavedModel.

O módulo tf.estimator.export contém funções para ajudar a construir esses receivers .

O código a seguir cria um receptor, baseado em feature_columns , que aceita buffers de protocolo tf.Example serializados, que são frequentemente usados ​​com tf-serving .

tmpdir = tempfile.mkdtemp()

= tf.estimator.export.build_parsing_serving_input_receiver_fn(

= os.path.join(tmpdir, 'from_estimator')
= estimator.export_saved_model(estimator_base_path, serving_input_fn)
Você também pode carregar e executar esse modelo, de python:

imported = tf.saved_model.load(estimator_path)

def predict(x):
= tf.train.Example()
return imported.signatures["predict"](
{'class_ids': <tf.Tensor: shape=(1, 1), dtype=int64, numpy=array([[1]])>, 'classes': <tf.Tensor: shape=(1, 1), dtype=string, numpy=array([[b'1']], dtype=object)>, 'all_classes': <tf.Tensor: shape=(1, 2), dtype=string, numpy=array([[b'0', b'1']], dtype=object)>, 'all_class_ids': <tf.Tensor: shape=(1, 2), dtype=int32, numpy=array([[0, 1]], dtype=int32)>, 'logits': <tf.Tensor: shape=(1, 1), dtype=float32, numpy=array([[0.2974025]], dtype=float32)>, 'logistic': <tf.Tensor: shape=(1, 1), dtype=float32, numpy=array([[0.5738074]], dtype=float32)>, 'probabilities': <tf.Tensor: shape=(1, 2), dtype=float32, numpy=array([[0.42619258, 0.5738074 ]], dtype=float32)>}
{'class_ids': <tf.Tensor: shape=(1, 1), dtype=int64, numpy=array([[0]])>, 'classes': <tf.Tensor: shape=(1, 1), dtype=string, numpy=array([[b'0']], dtype=object)>, 'all_classes': <tf.Tensor: shape=(1, 2), dtype=string, numpy=array([[b'0', b'1']], dtype=object)>, 'all_class_ids': <tf.Tensor: shape=(1, 2), dtype=int32, numpy=array([[0, 1]], dtype=int32)>, 'logits': <tf.Tensor: shape=(1, 1), dtype=float32, numpy=array([[-1.1919093]], dtype=float32)>, 'logistic': <tf.Tensor: shape=(1, 1), dtype=float32, numpy=array([[0.23291764]], dtype=float32)>, 'probabilities': <tf.Tensor: shape=(1, 2), dtype=float32, numpy=array([[0.7670824 , 0.23291762]], dtype=float32)>}

tf.estimator.export.build_raw_serving_input_receiver_fn permite que você crie funções de entrada que usam tensores brutos em vez de tf.train.Example s.

Usando tf.distribute.Strategy com Estimator (suporte limitado)

tf.estimator é uma API TensorFlow de treinamento distribuído que originalmente suportava a abordagem de servidor de parâmetros assíncrono. tf.estimator agora suporta tf.distribute.Strategy . Se você estiver usando tf.estimator , poderá mudar para treinamento distribuído com poucas alterações em seu código. Com isso, os usuários do Estimator agora podem fazer treinamento distribuído síncrono em várias GPUs e vários trabalhadores, além de usar TPUs. Esse suporte no Estimator é, no entanto, limitado. Confira a seção O que é compatível agora abaixo para obter mais detalhes.

Usar tf.distribute.Strategy com Estimator é um pouco diferente do caso Keras. Em vez de usar strategy.scope , agora você passa o objeto de estratégia para o RunConfig do Estimator.

Você pode consultar o guia de treinamento distribuído para obter mais informações.

Aqui está um trecho de código que mostra isso com um Estimator LinearRegressor e MirroredStrategy pré-fabricados:

mirrored_strategy = tf.distribute.MirroredStrategy()
= tf.estimator.RunConfig(
=mirrored_strategy, eval_distribute=mirrored_strategy)
= tf.estimator.LinearRegressor(
Aqui, você usa um estimador pré-fabricado, mas o mesmo código também funciona com um estimador personalizado. train_distribute determina como o treinamento será distribuído e eval_distribute determina como a avaliação será distribuída. Essa é outra diferença do Keras, onde você usa a mesma estratégia para treinamento e avaliação.

Agora você pode treinar e avaliar este Estimador com uma função de entrada:

def input_fn():
={"feats":[1.]}, [1.]))
return dataset.repeat(1000).batch(10)
.train(input_fn=input_fn, steps=10)
.evaluate(input_fn=input_fn, steps=10)
Outra diferença a destacar aqui entre o Estimator e o Keras é a manipulação de entrada. No Keras, cada lote do conjunto de dados é dividido automaticamente entre as várias réplicas. No Estimator, no entanto, você não executa a divisão automática de lotes nem fragmenta automaticamente os dados entre diferentes trabalhadores. Você tem controle total sobre como deseja que seus dados sejam distribuídos entre trabalhadores e dispositivos e deve fornecer um input_fn para especificar como distribuir seus dados.

Seu input_fn é chamado uma vez por trabalhador, dando assim um conjunto de dados por trabalhador. Em seguida, um lote desse conjunto de dados é alimentado para uma réplica nesse trabalhador, consumindo assim N lotes para N réplicas em 1 trabalhador. Em outras palavras, o conjunto de dados retornado pelo input_fn deve fornecer lotes de tamanho PER_REPLICA_BATCH_SIZE . E o tamanho global do lote para uma etapa pode ser obtido como PER_REPLICA_BATCH_SIZE * strategy.num_replicas_in_sync .

Ao realizar o treinamento de vários trabalhadores, você deve dividir seus dados entre os trabalhadores ou embaralhar com uma semente aleatória em cada um. Você pode conferir um exemplo de como fazer isso no tutorial Treinamento de vários trabalhadores com o estimador .

Da mesma forma, você também pode usar estratégias de vários trabalhadores e servidores de parâmetros. O código permanece o mesmo, mas você precisa usar tf.estimator.train_and_evaluate e definir variáveis ​​de ambiente TF_CONFIG para cada binário em execução em seu cluster.

O que é suportado agora?

Há suporte limitado para treinamento com Estimator usando todas as estratégias, exceto TPUStrategy . Treinamento e avaliação básicos devem funcionar, mas vários recursos avançados, como v1.train.Scaffold , não. Também pode haver vários bugs nessa integração e não há planos para melhorar ativamente esse suporte (o foco está no Keras e no suporte ao loop de treinamento personalizado). Se possível, você deve preferir usar tf.distribute com essas APIs.

API de treinamento Estratégia espelhada Estratégia TPU MultiWorkerMirroredStrategy Estratégia de armazenamento central ParameterServerStrategy
API do estimador Suporte limitado Não suportado Suporte limitado Suporte limitado Suporte limitado

Exemplos e tutoriais

Aqui estão alguns exemplos de ponta a ponta que mostram como usar várias estratégias com o Estimator:

  1. O tutorial Treinamento de vários trabalhadores com estimador mostra como você pode treinar com vários trabalhadores usando MultiWorkerMirroredStrategy no conjunto de dados MNIST.
  2. Um exemplo completo de execução de treinamento de vários trabalhadores com estratégias de distribuição no tensorflow/ecosystem usando modelos do Kubernetes. Ele começa com um modelo Keras e o converte em um estimador usando a API tf.keras.estimator.model_to_estimator .
  3. O modelo oficial do ResNet50 , que pode ser treinado usando MirroredStrategy ou MultiWorkerMirroredStrategy .