Ten dokument przedstawia tf.estimator
— wysokopoziomowy interfejs API TensorFlow. Estymatory zawierają następujące działania:
- Trening
- Ocena
- Przepowiednia
- Eksport do podania
TensorFlow wdraża kilka gotowych estymatorów. Niestandardowe estymatory są nadal obsługiwane, ale głównie jako miara kompatybilności wstecznej. W przypadku nowego kodu nie należy używać niestandardowych estymatorów . Wszystkie estymatory — gotowe lub niestandardowe — są klasami opartymi na klasie tf.estimator.Estimator
Aby uzyskać szybki przykład, wypróbuj samouczki estymatora . Omówienie projektu interfejsu API można znaleźć w białej księdze .
pip install -U tensorflow_datasets
import tempfile
import os
import tensorflow as tf
import tensorflow_datasets as tfds
Podobnie jak tf.keras.Model
, estimator
jest abstrakcją na poziomie modelu. tf.estimator
zapewnia pewne możliwości, które są obecnie wciąż rozwijane dla tf.keras
. To są:
- Szkolenie oparte na serwerze parametrów
- Pełna integracja TFX
Możliwości estymatorów
Estymatory zapewniają następujące korzyści:
- Modele oparte na estymatorze można uruchamiać na lokalnym hoście lub w rozproszonym środowisku wieloserwerowym bez zmiany modelu. Co więcej, możesz uruchamiać modele oparte na estymatorze na procesorach, GPU lub TPU bez przekodowywania modelu.
- Estymatory zapewniają bezpieczną, rozproszoną pętlę szkoleniową, która kontroluje, jak i kiedy:
- Załaduj dane
- Obsługa wyjątków
- Twórz pliki punktów kontrolnych i odzyskuj po awariach
- Zapisz streszczenia dla TensorBoard
Podczas pisania aplikacji z estymatorami należy oddzielić potok wprowadzania danych od modelu. Ta separacja upraszcza eksperymenty z różnymi zestawami danych.
Korzystanie z gotowych estymatorów
Gotowe estymatory umożliwiają pracę na znacznie wyższym poziomie koncepcyjnym niż podstawowe interfejsy API TensorFlow. Nie musisz już martwić się tworzeniem wykresu obliczeniowego lub sesji, ponieważ estymatory zajmują się całą „hydrauliką” za Ciebie. Ponadto gotowe estymatory umożliwiają eksperymentowanie z różnymi architekturami modeli, wprowadzając tylko minimalne zmiany w kodzie. tf.estimator.DNNClassifier
to na przykład gotowa klasa Estimator, która szkoli modele klasyfikacji oparte na gęstych sieciach neuronowych typu feed-forward.
Program TensorFlow oparty na gotowym estymatorze zazwyczaj składa się z następujących czterech kroków:
1. Napisz funkcje wejściowe
Na przykład możesz utworzyć jedną funkcję do importowania zestawu uczącego i inną funkcję do importowania zestawu testowego. Estymatorzy oczekują, że ich dane wejściowe będą sformatowane jako para obiektów:
- Słownik, w którym klucze są nazwami funkcji, a wartościami są Tensors (lub SparseTensors) zawierający odpowiednie dane funkcji
- Tensor zawierający co najmniej jedną etykietę
powinien zwrócić tf.data.Dataset
, który daje pary w tym formacie.
Na przykład poniższy kod tworzy zestaw tf.data.Dataset
z pliku train.csv
zestawu danych Titanica:
def train_input_fn():
titanic_file = tf.keras.utils.get_file("train.csv", "https://storage.googleapis.com/tf-datasets/titanic/train.csv")
titanic = tf.data.experimental.make_csv_dataset(
titanic_file, batch_size=32,
titanic_batches = (
return titanic_batches
jest wykonywany w tf.Graph
i może również bezpośrednio zwrócić parę (features_dics, labels)
zawierającą tensory wykresów, ale jest to podatne na błędy poza prostymi przypadkami, takimi jak zwracanie stałych.
2. Zdefiniuj kolumny funkcji.
Każda tf.feature_column
identyfikuje nazwę funkcji, jej typ i wszelkie wstępne przetwarzanie danych wejściowych.
Na przykład poniższy fragment kodu tworzy trzy kolumny funkcji.
- Pierwsza wykorzystuje funkcję
bezpośrednio jako dane zmiennoprzecinkowe. - Drugi używa funkcji
jako kategorycznego wejścia. - Trzeci używa
jako kategorycznego wejścia, ale używahashing trick
aby uniknąć konieczności wyliczania opcji i ustawiania liczby opcji.
Aby uzyskać więcej informacji, zapoznaj się z samouczkiem dotyczącym kolumn elementów .
age = tf.feature_column.numeric_column('age')
cls = tf.feature_column.categorical_column_with_vocabulary_list('class', ['First', 'Second', 'Third'])
embark = tf.feature_column.categorical_column_with_hash_bucket('embark_town', 32)
3. Utwórz wystąpienie odpowiedniego gotowego estymatora.
Na przykład, oto przykładowe wystąpienie gotowego estymatora o nazwie LinearClassifier
model_dir = tempfile.mkdtemp()
model = tf.estimator.LinearClassifier(
feature_columns=[embark, cls, age],
Aby uzyskać więcej informacji, zapoznaj się z samouczkiem dotyczącym klasyfikatorów liniowych .
4. Zadzwoń do metody szkolenia, oceny lub wnioskowania.
Wszystkie estymatory udostępniają metody train
, evaluate
i predict
model = model.train(input_fn=train_input_fn, steps=100)
result = model.evaluate(train_input_fn, steps=10)
for key, value in result.items():
print(key, ":", value)
for pred in model.predict(train_input_fn):
for key, value in pred.items():
print(key, ":", value)
Korzyści z gotowych estymatorów
Gotowe estymatory kodują najlepsze praktyki, zapewniając następujące korzyści:
- Najlepsze rozwiązania dotyczące określania, gdzie powinny być uruchamiane różne części grafu obliczeniowego, wdrażając strategie na pojedynczej maszynie lub w klastrze.
- Najlepsze praktyki w zakresie pisania zdarzeń (podsumowań) i podsumowań przydatnych powszechnie.
Jeśli nie korzystasz z gotowych estymatorów, musisz samodzielnie zaimplementować powyższe funkcje.
Niestandardowe estymatory
Sercem każdego estymatora — zarówno gotowego, jak i niestandardowego — jest jego funkcja modelu , model_fn
, która jest metodą, która tworzy wykresy do uczenia, oceny i przewidywania. Kiedy korzystasz z gotowego estymatora, ktoś inny już zaimplementował funkcję modelu. Opierając się na niestandardowym estymatorze, musisz samodzielnie napisać funkcję modelu.
Utwórz estymator z modelu Keras
Możesz przekonwertować istniejące modele Keras na estymatory za pomocą tf.keras.estimator.model_to_estimator
. Jest to przydatne, jeśli chcesz zmodernizować kod modelu, ale potok uczenia nadal wymaga estymatorów.
Utwórz wystąpienie modelu Keras MobileNet V2 i skompiluj model z optymalizatorem, stratami i metrykami do trenowania z:
keras_mobilenet_v2 = tf.keras.applications.MobileNetV2(
input_shape=(160, 160, 3), include_top=False)
keras_mobilenet_v2.trainable = False
estimator_model = tf.keras.Sequential([
# Compile the model
Utwórz Estimator
ze skompilowanego modelu Keras. Początkowy stan modelu Keras jest zachowany w utworzonym Estimator
est_mobilenet_v2 = tf.keras.estimator.model_to_estimator(keras_model=estimator_model)
Traktuj pochodny Estimator
tak samo, jak każdy inny Estimator
IMG_SIZE = 160 # All images will be resized to 160x160
def preprocess(image, label):
image = tf.cast(image, tf.float32)
image = (image/127.5) - 1
image = tf.image.resize(image, (IMG_SIZE, IMG_SIZE))
return image, label
def train_input_fn(batch_size):
data = tfds.load('cats_vs_dogs', as_supervised=True)
train_data = data['train']
train_data = train_data.map(preprocess).shuffle(500).batch(batch_size)
return train_data
Aby trenować, wywołaj funkcję pociągu estymatora:
est_mobilenet_v2.train(input_fn=lambda: train_input_fn(32), steps=50)
Podobnie, aby ocenić, wywołaj funkcję oceny estymatora:
est_mobilenet_v2.evaluate(input_fn=lambda: train_input_fn(32), steps=10)
Aby uzyskać więcej informacji, zapoznaj się z dokumentacją tf.keras.estimator.model_to_estimator
Zapisywanie punktów kontrolnych opartych na obiektach za pomocą Estimatora
Estymatory domyślnie zapisują punkty kontrolne z nazwami zmiennych, a nie wykresem obiektów opisanym w przewodniku po punktach kontrolnych . tf.train.Checkpoint
odczyta punkty kontrolne oparte na nazwach, ale nazwy zmiennych mogą się zmienić podczas przenoszenia części modelu poza model_fn
. W celu zapewnienia zgodności w przód zapisanie punktów kontrolnych opartych na obiektach ułatwia trenowanie modelu w estymatorze, a następnie używanie go poza nim.
import tensorflow.compat.v1 as tf_compat
def toy_dataset():
inputs = tf.range(10.)[:, None]
labels = inputs * 5. + tf.range(5.)[None, :]
return tf.data.Dataset.from_tensor_slices(
dict(x=inputs, y=labels)).repeat().batch(2)
class Net(tf.keras.Model):
"""A simple linear model."""
def __init__(self):
super(Net, self).__init__()
self.l1 = tf.keras.layers.Dense(5)
def call(self, x):
return self.l1(x)
def model_fn(features, labels, mode):
net = Net()
opt = tf.keras.optimizers.Adam(0.1)
ckpt = tf.train.Checkpoint(step=tf_compat.train.get_global_step(),
optimizer=opt, net=net)
with tf.GradientTape() as tape:
output = net(features['x'])
loss = tf.reduce_mean(tf.abs(output - features['y']))
variables = net.trainable_variables
gradients = tape.gradient(loss, variables)
return tf.estimator.EstimatorSpec(
train_op=tf.group(opt.apply_gradients(zip(gradients, variables)),
# Tell the Estimator to save "ckpt" in an object-based format.
est = tf.estimator.Estimator(model_fn, './tf_estimator_example/')
est.train(toy_dataset, steps=10)
może następnie załadować punkty kontrolne estymatora z jego model_dir
opt = tf.keras.optimizers.Adam(0.1)
net = Net()
ckpt = tf.train.Checkpoint(
step=tf.Variable(1, dtype=tf.int64), optimizer=opt, net=net)
ckpt.step.numpy() # From est.train(..., steps=10)
Zapisane modele z estymatorów
Estymatory eksportują SavedModels za pośrednictwem tf.Estimator.export_saved_model
input_column = tf.feature_column.numeric_column("x")
estimator = tf.estimator.LinearClassifier(feature_columns=[input_column])
def input_fn():
return tf.data.Dataset.from_tensor_slices(
({"x": [1., 2., 3., 4.]}, [1, 1, 0, 0])).repeat(200).shuffle(64).batch(16)
Aby zapisać Estimator
, musisz serving_input_receiver
. Ta funkcja buduje część tf.Graph
, która analizuje surowe dane otrzymane przez SavedModel.
Moduł tf.estimator.export
zawiera funkcje ułatwiające budowanie tych receivers
Poniższy kod buduje odbiornik na podstawie feature_columns
, który akceptuje serializowane bufory protokołu tf.Example
, które są często używane z tf-serving .
tmpdir = tempfile.mkdtemp()
serving_input_fn = tf.estimator.export.build_parsing_serving_input_receiver_fn(
estimator_base_path = os.path.join(tmpdir, 'from_estimator')
estimator_path = estimator.export_saved_model(estimator_base_path, serving_input_fn)
Możesz także załadować i uruchomić ten model z Pythona:
imported = tf.saved_model.load(estimator_path)
def predict(x):
example = tf.train.Example()
return imported.signatures["predict"](
umożliwia tworzenie funkcji wejściowych, które przyjmują surowe tensory zamiast tf.train.Example
Korzystanie z tf.distribute.Strategy
z estymatorem (wsparcie ograniczone)
to rozproszony interfejs API TensorFlow do szkolenia, który pierwotnie obsługiwał podejście serwera parametrów asynchronicznych. tf.estimator
obsługuje teraz tf.distribute.Strategy
. Jeśli używasz tf.estimator
, możesz przejść na szkolenie rozproszone, wprowadzając niewiele zmian w kodzie. Dzięki temu użytkownicy programu Estimator mogą teraz przeprowadzać synchroniczne, rozproszone szkolenia na wielu procesorach graficznych i wielu pracownikach, a także korzystać z TPU. To wsparcie w programie Estimator jest jednak ograniczone. Sprawdź poniżej sekcję Co jest teraz obsługiwane, aby uzyskać więcej informacji.
Używanie tf.distribute.Strategy
z Estimatorem jest nieco inne niż w przypadku Keras. Zamiast używać strategy.scope
, teraz przekazujesz obiekt strategii do RunConfig
dla estymatora.
Więcej informacji można znaleźć w rozproszonym przewodniku szkoleniowym .
Oto fragment kodu, który pokazuje to za pomocą LinearRegressor
i MirroredStrategy
mirrored_strategy = tf.distribute.MirroredStrategy()
config = tf.estimator.RunConfig(
train_distribute=mirrored_strategy, eval_distribute=mirrored_strategy)
regressor = tf.estimator.LinearRegressor(
Tutaj używasz gotowego estymatora, ale ten sam kod działa również z niestandardowym estymatorem. train_distribute
określa sposób dystrybucji szkolenia, a eval_distribute
określa sposób dystrybucji oceny. To kolejna różnica w porównaniu z Kerasem, w którym używa się tej samej strategii zarówno do treningu, jak i do ewaluacji.
Teraz możesz trenować i oceniać ten estymator za pomocą funkcji wejściowej:
def input_fn():
dataset = tf.data.Dataset.from_tensors(({"feats":[1.]}, [1.]))
return dataset.repeat(1000).batch(10)
regressor.train(input_fn=input_fn, steps=10)
regressor.evaluate(input_fn=input_fn, steps=10)
Kolejną różnicą, którą należy tutaj podkreślić między Estimatorem i Kerasem, jest obsługa danych wejściowych. W Keras każda partia zestawu danych jest automatycznie dzielona na wiele replik. Jednak w programie Estimator nie wykonuje się automatycznego dzielenia partii ani automatycznego dzielenia danych między różne procesy robocze. Masz pełną kontrolę nad tym, jak chcesz, aby Twoje dane były dystrybuowane między pracownikami i urządzeniami, i musisz podać input_fn
, aby określić sposób dystrybucji danych.
Twoje input_fn
jest wywoływane raz na pracownika, co daje jeden zestaw danych na pracownika. Następnie jedna partia z tego zestawu danych jest przekazywana do jednej repliki w tym procesie roboczym, zużywając w ten sposób N partii dla N replik w 1 procesie roboczym. Innymi słowy, zestaw danych zwrócony przez input_fn
powinien zawierać partie o rozmiarze PER_REPLICA_BATCH_SIZE
. Globalny rozmiar partii dla kroku można uzyskać jako PER_REPLICA_BATCH_SIZE * strategy.num_replicas_in_sync
Podczas szkolenia z wieloma pracownikami należy albo podzielić dane między pracowników, albo przetasować z losowym ziarnem na każdym z nich. Możesz sprawdzić przykład, jak to zrobić, w samouczku Szkolenie dla wielu pracowników z estymatorem .
I podobnie, możesz również użyć strategii wielu procesów roboczych i serwera parametrów. Kod pozostaje ten sam, ale musisz użyć tf.estimator.train_and_evaluate
i ustawić zmienne środowiskowe TF_CONFIG
dla każdego pliku binarnego działającego w klastrze.
Co jest teraz obsługiwane?
Obsługa szkolenia z narzędziem Estimator przy użyciu wszystkich strategii z wyjątkiem TPUStrategy
jest ograniczona. Podstawowe szkolenie i ocena powinny działać, ale wiele zaawansowanych funkcji, takich jak v1.train.Scaffold
, nie. W tej integracji może być również wiele błędów i nie ma planów aktywnego ulepszania tej obsługi (nacisk kładziony jest na obsługę Keras i niestandardowej pętli treningowej). Jeśli to w ogóle możliwe, powinieneś zamiast tego używać tf.distribute
z tymi interfejsami API.
Szkolenia API | Strategia lustrzana | Strategia TPU | MultiWorkerMirroredStrategy | Centralna strategia magazynowania | Strategia serwera parametrów |
Interfejs API estymatora | Ograniczone wsparcie | Nieobsługiwany | Ograniczone wsparcie | Ograniczone wsparcie | Ograniczone wsparcie |
Przykłady i tutoriale
Oto kilka kompleksowych przykładów, które pokazują, jak korzystać z różnych strategii w narzędziu Estimator:
- Samouczek Szkolenie dla wielu pracowników z narzędziem szacowania pokazuje, jak można szkolić wielu pracowników przy użyciu
w zestawie danych MNIST. - Kompleksowy przykład prowadzenia szkolenia dla wielu pracowników ze strategiami dystrybucji w
przy użyciu szablonów Kubernetes. Zaczyna się od modelu Keras i konwertuje go na estymator za pomocą interfejsu APItf.keras.estimator.model_to_estimator
- Oficjalny model ResNet50 , który można trenować za pomocą