Примеры миграции: стандартные оценщики

Стандартные (или готовые) оценщики традиционно использовались в TensorFlow 1 как быстрые и простые способы обучения моделей для различных типичных случаев использования. TensorFlow 2 предлагает простые приблизительные замены для некоторых из них с помощью моделей Keras. Для тех постоянных оценок, которые не имеют встроенных заменителей TensorFlow 2, вы все равно можете довольно легко создать свою собственную замену.

В этом руководстве рассматриваются несколько примеров прямых эквивалентов и пользовательских замен, чтобы продемонстрировать, как модели tf.estimator 1, производные от tf.estimator, можно перенести в TF2 с помощью Keras.

А именно, это руководство включает примеры для миграции:

Обычным предшественником обучения модели является предварительная обработка признаков, которая выполняется для моделей TensorFlow 1 Estimator с помощью tf.feature_column . Дополнительные сведения о предварительной обработке признаков в TensorFlow 2 см. в этом руководстве по переносу столбцов признаков .


Начните с пары необходимых импортов TensorFlow,

pip install tensorflow_decision_forests
import keras
import pandas as pd
import tensorflow as tf
import tensorflow.compat.v1 as tf1
import tensorflow_decision_forests as tfdf
WARNING:root:TF Parameter Server distributed training not available (this is expected for the pre-build release).

подготовить несколько простых данных для демонстрации из стандартного набора данных Titanic,

x_train = pd.read_csv('https://storage.googleapis.com/tf-datasets/titanic/train.csv')
= pd.read_csv('https://storage.googleapis.com/tf-datasets/titanic/eval.csv')
['sex'].replace(('male', 'female'), (0, 1), inplace=True)
['sex'].replace(('male', 'female'), (0, 1), inplace=True)

['alone'].replace(('n', 'y'), (0, 1), inplace=True)
['alone'].replace(('n', 'y'), (0, 1), inplace=True)

['class'].replace(('First', 'Second', 'Third'), (1, 2, 3), inplace=True)
['class'].replace(('First', 'Second', 'Third'), (1, 2, 3), inplace=True)

.drop(['embark_town', 'deck'], axis=1, inplace=True)
.drop(['embark_town', 'deck'], axis=1, inplace=True)

= x_train.pop('survived')
= x_eval.pop('survived')
# Data setup for TensorFlow 1 with `tf.estimator`
def _input_fn():
return tf1.data.Dataset.from_tensor_slices((dict(x_train), y_train)).batch(32)

def _eval_input_fn():
return tf1.data.Dataset.from_tensor_slices((dict(x_eval), y_eval)).batch(32)

= [
'age', 'fare', 'sex', 'n_siblings_spouses', 'parch', 'class', 'alone'

= []
for fn in FEATURE_NAMES:
= tf1.feature_column.numeric_column(fn, dtype=tf.float32)

и создайте метод для создания экземпляра упрощенного оптимизатора выборки для использования с нашими различными моделями TensorFlow 1 Estimator и TensorFlow 2 Keras.

def create_sample_optimizer(tf_version):
if tf_version == 'tf1':
= lambda: tf.keras.optimizers.Ftrl(
elif tf_version == 'tf2':
= tf.keras.optimizers.Ftrl(
=0.1, decay_steps=10000, decay_rate=0.9))
return optimizer

Пример 1: Миграция с LinearEstimator

TF1: использование LinearEstimator

В TensorFlow 1 вы можете использовать tf.estimator.LinearEstimator для создания базовой линейной модели для задач регрессии и классификации.

linear_estimator = tf.estimator.LinearEstimator(
linear_estimator.train(input_fn=_input_fn, steps=100)
.evaluate(input_fn=_eval_input_fn, steps=10)
{'accuracy': 0.70075756,
 'accuracy_baseline': 0.625,
 'auc': 0.75472915,
 'auc_precision_recall': 0.65362054,
 'average_loss': 0.5759378,
 'label/mean': 0.375,
 'loss': 0.5704812,
 'precision': 0.6388889,
 'prediction/mean': 0.41331062,
 'recall': 0.46464646,
 'global_step': 20}

TF2: использование линейной модели Keras

В TensorFlow 2 вы можете создать экземпляр tf.compat.v1.keras.models.LinearModel , который заменит tf.estimator.LinearEstimator . Путь tf.compat.v1.keras используется для обозначения того, что для совместимости существует готовая модель.

linear_model = tf.compat.v1.keras.experimental.LinearModel()
.compile(loss='mse', optimizer=create_sample_optimizer('tf2'), metrics=['accuracy'])
.fit(x_train, y_train, epochs=10)
.evaluate(x_eval, y_eval, return_dict=True)
Epoch 1/10
20/20 [==============================] - 0s 2ms/step - loss: 2.8157 - accuracy: 0.6300
Epoch 2/10
20/20 [==============================] - 0s 2ms/step - loss: 0.2758 - accuracy: 0.6427
Epoch 3/10
20/20 [==============================] - 0s 2ms/step - loss: 0.2470 - accuracy: 0.6699
Epoch 4/10
20/20 [==============================] - 0s 2ms/step - loss: 0.1954 - accuracy: 0.7177
Epoch 5/10
20/20 [==============================] - 0s 2ms/step - loss: 0.1931 - accuracy: 0.7145
Epoch 6/10
20/20 [==============================] - 0s 2ms/step - loss: 0.1816 - accuracy: 0.7496
Epoch 7/10
20/20 [==============================] - 0s 2ms/step - loss: 0.1766 - accuracy: 0.7751
Epoch 8/10
20/20 [==============================] - 0s 2ms/step - loss: 0.2198 - accuracy: 0.7560
Epoch 9/10
20/20 [==============================] - 0s 2ms/step - loss: 0.1657 - accuracy: 0.7959
Epoch 10/10
20/20 [==============================] - 0s 2ms/step - loss: 0.1738 - accuracy: 0.7959
9/9 [==============================] - 0s 2ms/step - loss: 0.2278 - accuracy: 0.6780
{'loss': 0.22778697311878204, 'accuracy': 0.6780303120613098}

Пример 2: Миграция с DNNEstimator

TF1: использование DNNEestimator

В TensorFlow 1 вы можете использовать tf.estimator.DNNEstimator для создания базовой модели DNN для задач регрессии и классификации.

dnn_estimator = tf.estimator.DNNEstimator(
dnn_estimator.train(input_fn=_input_fn, steps=100)
.evaluate(input_fn=_eval_input_fn, steps=10)
{'accuracy': 0.7083333,
 'accuracy_baseline': 0.625,
 'auc': 0.70716256,
 'auc_precision_recall': 0.6146256,
 'average_loss': 0.60399944,
 'label/mean': 0.375,
 'loss': 0.5986442,
 'precision': 0.6486486,
 'prediction/mean': 0.41256863,
 'recall': 0.4848485,
 'global_step': 20}

TF2: использование Keras для создания пользовательской модели DNN

В TensorFlow 2 вы можете создать пользовательскую модель DNN для замены модели, созданной tf.estimator.DNNEstimator , с аналогичными уровнями пользовательской настройки (например, как в предыдущем примере, возможность настроить выбранный оптимизатор модели) .

Аналогичный рабочий процесс можно использовать для замены tf.estimator.experimental.RNNEstimator RNN. Keras предоставляет ряд встроенных настраиваемых опций с помощью tf.keras.layers.RNN , tf.keras.layers.LSTM и tf.keras.layers.GRU — см. здесь для получения более подробной информации.

dnn_model = tf.keras.models.Sequential(
[tf.keras.layers.Dense(128, activation='relu'),

.compile(loss='mse', optimizer=create_sample_optimizer('tf2'), metrics=['accuracy'])
dnn_model.fit(x_train, y_train, epochs=10)
.evaluate(x_eval, y_eval, return_dict=True)
Epoch 1/10
20/20 [==============================] - 0s 2ms/step - loss: 551.2993 - accuracy: 0.5997
Epoch 2/10
20/20 [==============================] - 0s 2ms/step - loss: 16.8562 - accuracy: 0.6427
Epoch 3/10
20/20 [==============================] - 0s 2ms/step - loss: 0.3048 - accuracy: 0.7161
Epoch 4/10
20/20 [==============================] - 0s 2ms/step - loss: 0.2475 - accuracy: 0.7416
Epoch 5/10
20/20 [==============================] - 0s 2ms/step - loss: 0.2334 - accuracy: 0.7512
Epoch 6/10
20/20 [==============================] - 0s 2ms/step - loss: 0.2200 - accuracy: 0.7416
Epoch 7/10
20/20 [==============================] - 0s 2ms/step - loss: 0.2012 - accuracy: 0.7656
Epoch 8/10
20/20 [==============================] - 0s 2ms/step - loss: 0.2025 - accuracy: 0.7624
Epoch 9/10
20/20 [==============================] - 0s 2ms/step - loss: 0.2185 - accuracy: 0.7703
Epoch 10/10
20/20 [==============================] - 0s 2ms/step - loss: 0.2046 - accuracy: 0.7687
9/9 [==============================] - 0s 2ms/step - loss: 0.2227 - accuracy: 0.6856
{'loss': 0.2227054387331009, 'accuracy': 0.685606062412262}

Пример 3. Миграция с DNNLinearCombinedEstimator

TF1: использование DNNLinearCombinedEstimator

В TensorFlow 1 вы можете использовать tf.estimator.DNNLinearCombinedEstimator для создания базовой комбинированной модели для задач регрессии и классификации с возможностью настройки как линейных компонентов, так и компонентов DNN.

optimizer = create_sample_optimizer('tf1')

= tf.estimator.DNNLinearCombinedEstimator(
# Wide settings
# Deep settings
combined_estimator.train(input_fn=_input_fn, steps=100)
.evaluate(input_fn=_eval_input_fn, steps=10)
{'accuracy': 0.6931818,
 'accuracy_baseline': 0.625,
 'auc': 0.73532283,
 'auc_precision_recall': 0.630229,
 'average_loss': 0.65179086,
 'label/mean': 0.375,
 'loss': 0.63768697,
 'precision': 0.60714287,
 'prediction/mean': 0.4162652,
 'recall': 0.5151515,
 'global_step': 20}

TF2: использование Keras WideDeepModel

В TensorFlow 2 вы можете создать экземпляр tf.compat.v1.keras.models.WideDeepModel , чтобы заменить экземпляр, сгенерированный tf.estimator.DNNLinearCombinedEstimator , с аналогичными уровнями пользовательской настройки (например, как в предыдущий пример, возможность настройки оптимизатора выбранной модели).

Эта WideDeepModel построена на основе составной LinearModel и пользовательской модели DNN, обе из которых обсуждаются в предыдущих двух примерах. Пользовательскую линейную модель также можно использовать вместо встроенной линейной модели LinearModel , если это необходимо.

Если вы хотите построить свою собственную модель вместо стандартного оценщика, узнайте, как построить модель keras.Sequential . Для получения дополнительной информации о специальном обучении и оптимизаторах вы также можете ознакомиться с этим руководством .

# Create LinearModel and DNN Model as in Examples 1 and 2
= create_sample_optimizer('tf2')

= tf.compat.v1.keras.experimental.LinearModel()
.compile(loss='mse', optimizer=optimizer, metrics=['accuracy'])
.fit(x_train, y_train, epochs=10, verbose=0)

= tf.keras.models.Sequential(
[tf.keras.layers.Dense(128, activation='relu'),
.compile(loss='mse', optimizer=optimizer, metrics=['accuracy'])
combined_model = tf.compat.v1.keras.experimental.WideDeepModel(linear_model,
=[optimizer, optimizer], loss='mse', metrics=['accuracy'])
.fit([x_train, x_train], y_train, epochs=10)
.evaluate(x_eval, y_eval, return_dict=True)
Epoch 1/10
20/20 [==============================] - 0s 2ms/step - loss: 1118.0448 - accuracy: 0.6715
Epoch 2/10
20/20 [==============================] - 0s 2ms/step - loss: 0.5682 - accuracy: 0.7305
Epoch 3/10
20/20 [==============================] - 0s 2ms/step - loss: 0.2719 - accuracy: 0.7671
Epoch 4/10
20/20 [==============================] - 0s 2ms/step - loss: 0.2032 - accuracy: 0.7831
Epoch 5/10
20/20 [==============================] - 0s 2ms/step - loss: 0.1911 - accuracy: 0.7783
Epoch 6/10
20/20 [==============================] - 0s 2ms/step - loss: 0.1895 - accuracy: 0.7863
Epoch 7/10
20/20 [==============================] - 0s 2ms/step - loss: 0.1882 - accuracy: 0.7863
Epoch 8/10
20/20 [==============================] - 0s 2ms/step - loss: 0.1717 - accuracy: 0.7974
Epoch 9/10
20/20 [==============================] - 0s 2ms/step - loss: 0.1701 - accuracy: 0.7927
Epoch 10/10
20/20 [==============================] - 0s 2ms/step - loss: 0.1684 - accuracy: 0.7990
9/9 [==============================] - 0s 2ms/step - loss: 0.1930 - accuracy: 0.7424
{'loss': 0.19299836456775665, 'accuracy': 0.7424242496490479}

Пример 4: Миграция с BoostedTreesEstimator

TF1: использование BoostedTreesEstimator

В TensorFlow 1 вы могли использовать tf.estimator.BoostedTreesEstimator для создания базовой линии для создания базовой модели повышения градиента с использованием ансамбля деревьев решений для задач регрессии и классификации. Эта функция больше не включена в TensorFlow 2.

bt_estimator = tf1.estimator.BoostedTreesEstimator(
bt_estimator.train(input_fn=_input_fn, steps=1000)
.evaluate(input_fn=_eval_input_fn, steps=100)

TF2: Использование леса принятия решений TensorFlow

В TensorFlow 2 ближайшей предварительно упакованной заменой модели, сгенерированной tf.estimator.BoostedTreesEstimator , является модель, созданная с использованием tfdf.keras.GradientBoostedTreesModel , которая создает последовательно обученную последовательность неглубоких деревьев решений, каждое из которых предназначено для «обучения» на ошибках. сделанные его предшественниками в последовательности.

GradientBoostedTreesModel предоставляет больше возможностей для настройки, позволяя задавать все, от базовых ограничений глубины до условий ранней остановки. Дополнительные сведения об атрибуте GradientBoostedTreesModel см. здесь .

gbt_model = tfdf.keras.GradientBoostedTreesModel(
.compile(metrics=['mse', 'accuracy'])
train_df, eval_df = x_train.copy(), x_eval.copy()
['survived'], eval_df['survived'] = y_train, y_eval

= tfdf.keras.pd_dataframe_to_tf_dataset(train_df, label='survived')
= tfdf.keras.pd_dataframe_to_tf_dataset(eval_df, label='survived')

.evaluate(eval_dataset, return_dict=True)
1/1 [==============================] - 0s 388ms/step - loss: 0.0000e+00 - mse: 0.1308 - accuracy: 0.8144
{'loss': 0.0, 'mse': 0.13076548278331757, 'accuracy': 0.814393937587738}

В TensorFlow 2 также есть другой доступный TFDF-заменитель модели, сгенерированной tf.estimator.BoostedTreesEstimatortfdf.keras.RandomForestModel . RandomForestModel создает надежный, устойчивый к переобучению обучаемый модуль, состоящий из голосующей популяции глубоких деревьев решений, каждое из которых обучено на случайных подмножествах входного обучающего набора данных.

RandomForestModel и GradientBoostedTreesModel обеспечивают столь же широкие уровни настройки. Выбор между ними зависит от конкретной проблемы и вашей задачи или приложения.

Дополнительные сведения об RandomForestModel и GradientBoostedTreesModel см. в документации по API.

rf_model = tfdf.keras.RandomForestModel(
.compile(metrics=['mse', 'accuracy'])
.evaluate(eval_dataset, return_dict=True)
1/1 [==============================] - 0s 123ms/step - loss: 0.0000e+00 - mse: 0.1270 - accuracy: 0.8636
{'loss': 0.0, 'mse': 0.12698587775230408, 'accuracy': 0.8636363744735718}