Canned(または既製)Estimator は、TensorFlow 1 でさまざまな典型的なユースケースのモデルをトレーニングするための迅速かつ簡単な方法として従来使用されてきました。 TensorFlow 2 は、Keras モデルを介して、それらの多くの単純な近似代用を提供します。 TensorFlow 2 の代用が組み込まれていない Canned Estimator の場合でも、独自の置換をかなり簡単に構築できます。
このガイドでは、TensorFlow 1 の tf.estimator
から派生したモデルを Keras を使用して TensorFlow 2 に移行する方法を示すために、直接相当するものとカスタム置換の例をいくつか紹介します。
- TensorFlow 1 の
から、TensorFlow 2 のtf.compat.v1.keras.models.LinearModel
へ - TensorFlow 1 の
から、TensorFlow 2 のカスタム Keras DNN ModelKeras へ - TensorFlow 1 の
から、TensorFlow 2 のtf.compat.v1.keras.models.WideDeepModel
へ - TensorFlow 1 の
から、TensorFlow 2 のtfdf.keras.GradientBoostedTreesModel
を使用して TensorFlow 1 Estimator モデルに対して行われます。TensorFlow 2 での特徴量の前処理の詳細については、特徴量列から Keras 前処理レイヤー API への移行に関するこのガイドをご覧ください。
いくつかの必要な TensorFlow インポートから始めます。
pip install tensorflow_decision_forests
import keras
import pandas as pd
import tensorflow as tf
import tensorflow.compat.v1 as tf1
import tensorflow_decision_forests as tfdf
x_train = pd.read_csv('')
x_eval = pd.read_csv('')
x_train['sex'].replace(('male', 'female'), (0, 1), inplace=True)
x_eval['sex'].replace(('male', 'female'), (0, 1), inplace=True)
x_train['alone'].replace(('n', 'y'), (0, 1), inplace=True)
x_eval['alone'].replace(('n', 'y'), (0, 1), inplace=True)
x_train['class'].replace(('First', 'Second', 'Third'), (1, 2, 3), inplace=True)
x_eval['class'].replace(('First', 'Second', 'Third'), (1, 2, 3), inplace=True)
x_train.drop(['embark_town', 'deck'], axis=1, inplace=True)
x_eval.drop(['embark_town', 'deck'], axis=1, inplace=True)
y_train = x_train.pop('survived')
y_eval = x_eval.pop('survived')
# Data setup for TensorFlow 1 with `tf.estimator`
def _input_fn():
return, y_train)).batch(32)
def _eval_input_fn():
return, y_eval)).batch(32)
'age', 'fare', 'sex', 'n_siblings_spouses', 'parch', 'class', 'alone'
feature_columns = []
for fn in FEATURE_NAMES:
feat_col = tf1.feature_column.numeric_column(fn, dtype=tf.float32)
そして、さまざまな TensorFlow 1 Estimator および TensorFlow 2 Keras モデルで使用する単純なサンプルオプティマイザをインスタンス化するメソッドを作成します。
def create_sample_optimizer(tf_version):
if tf_version == 'tf1':
optimizer = lambda: tf.keras.optimizers.legacy.Ftrl(
elif tf_version == 'tf2':
optimizer = tf.keras.optimizers.legacy.Ftrl(
initial_learning_rate=0.1, decay_steps=10000, decay_rate=0.9))
return optimizer
例 1: LinearEstimator からの移行
TensorFlow 1: LinearEstimator の使用
TensorFlow 1 では、tf.estimator.LinearEstimator
linear_estimator = tf.estimator.LinearEstimator(
TensorFlow 2: Keras LinearModel の使用
TensorFlow 2 では、tf.estimator.LinearEstimator
の代替である Keras tf.compat.v1.keras.models.LinearModel
linear_model = tf.compat.v1.keras.experimental.LinearModel()
linear_model.compile(loss='mse', optimizer=create_sample_optimizer('tf2'), metrics=['accuracy']), y_train, epochs=10)
linear_model.evaluate(x_eval, y_eval, return_dict=True)
Epoch 1/10 20/20 [==============================] - 1s 2ms/step - loss: 4.3678 - accuracy: 0.6045 Epoch 2/10 20/20 [==============================] - 0s 2ms/step - loss: 0.2211 - accuracy: 0.6715 Epoch 3/10 20/20 [==============================] - 0s 2ms/step - loss: 0.2662 - accuracy: 0.6635 Epoch 4/10 20/20 [==============================] - 0s 2ms/step - loss: 0.1962 - accuracy: 0.6970 Epoch 5/10 20/20 [==============================] - 0s 2ms/step - loss: 0.1922 - accuracy: 0.7225 Epoch 6/10 20/20 [==============================] - 0s 2ms/step - loss: 0.1716 - accuracy: 0.7576 Epoch 7/10 20/20 [==============================] - 0s 2ms/step - loss: 0.1725 - accuracy: 0.7656 Epoch 8/10 20/20 [==============================] - 0s 2ms/step - loss: 0.1801 - accuracy: 0.7608 Epoch 9/10 20/20 [==============================] - 0s 2ms/step - loss: 0.1639 - accuracy: 0.8070 Epoch 10/10 20/20 [==============================] - 0s 2ms/step - loss: 0.1635 - accuracy: 0.8038 9/9 [==============================] - 0s 2ms/step - loss: 0.1796 - accuracy: 0.7462 {'loss': 0.1795806735754013, 'accuracy': 0.7462121248245239}
例 2: DNNEstimator からの移行
TensorFlow 1: DNNEstimator の使用
TensorFlow 1 では、tf.estimator.DNNEstimator
dnn_estimator = tf.estimator.DNNEstimator(
dnn_estimator.train(input_fn=_input_fn, steps=100)
dnn_estimator.evaluate(input_fn=_eval_input_fn, steps=10)
TensorFlow 2: Keras を使用してカスタム DNN モデルを作成する
TensorFlow 2 では、カスタム DNN モデルを作成して、tf.estimator.DNNEstimator
を Keras 再帰型ニューラルネットワーク(RNN)モデルに置き換えることができます。Keras は、tf.keras.layers.RNN
、および tf.keras.layers.GRU
によって、多数の組み込みのカスタマイズ可能な選択肢を提供します。詳細については、Keras を使用した RNN ガイドの組み込み RNN レイヤー: 簡単な例をご覧ください。
dnn_model = tf.keras.models.Sequential(
[tf.keras.layers.Dense(128, activation='relu'),
dnn_model.compile(loss='mse', optimizer=create_sample_optimizer('tf2'), metrics=['accuracy']), y_train, epochs=10)
dnn_model.evaluate(x_eval, y_eval, return_dict=True)
Epoch 1/10 20/20 [==============================] - 0s 2ms/step - loss: 638.0258 - accuracy: 0.5518 Epoch 2/10 20/20 [==============================] - 0s 2ms/step - loss: 0.2738 - accuracy: 0.6459 Epoch 3/10 20/20 [==============================] - 0s 2ms/step - loss: 0.2556 - accuracy: 0.6762 Epoch 4/10 20/20 [==============================] - 0s 2ms/step - loss: 0.1932 - accuracy: 0.6986 Epoch 5/10 20/20 [==============================] - 0s 2ms/step - loss: 0.1908 - accuracy: 0.7337 Epoch 6/10 20/20 [==============================] - 0s 2ms/step - loss: 0.2015 - accuracy: 0.7368 Epoch 7/10 20/20 [==============================] - 0s 2ms/step - loss: 0.1910 - accuracy: 0.7432 Epoch 8/10 20/20 [==============================] - 0s 2ms/step - loss: 0.2264 - accuracy: 0.7289 Epoch 9/10 20/20 [==============================] - 0s 2ms/step - loss: 0.1711 - accuracy: 0.7735 Epoch 10/10 20/20 [==============================] - 0s 2ms/step - loss: 0.1928 - accuracy: 0.7656 9/9 [==============================] - 0s 2ms/step - loss: 0.1969 - accuracy: 0.7121 {'loss': 0.19687658548355103, 'accuracy': 0.7121211886405945}
例 3: DNNLinearCombinedEstimator からの移行
TensorFlow 1: DNNLinearCombinedEstimator の使用
TensorFlow 1 では、tf.estimator.DNNLinearCombinedEstimator
を使用して、線形コンポーネントと DNN コンポーネントの両方のカスタマイズ機能を備えた回帰および分類問題のベースライン結合モデルを作成できます。
optimizer = create_sample_optimizer('tf1')
combined_estimator = tf.estimator.DNNLinearCombinedEstimator(
# Wide settings
# Deep settings
combined_estimator.train(input_fn=_input_fn, steps=100)
combined_estimator.evaluate(input_fn=_eval_input_fn, steps=10)
TensorFlow 2: Keras WideDeepModel の使用
TensorFlow 2 では、Keras の tf.compat.v1.keras.models.WideDeepModel
この WideDeepModel
は、構成要素である LinearModel
とカスタム DNN モデルに基づいて構築されます。どちらも前の 2 つの例で説明されています。必要に応じて、組み込みの LinearModel
Canned Estimator の代わりに独自のモデルを構築したい場合は、 Keras Sequential モデルガイドをご覧ください。カスタムトレーニングとオプティマイザの詳細については、カスタムトレーニング: チュートリアルガイドをご覧ください。
# Create LinearModel and DNN Model as in Examples 1 and 2
optimizer = create_sample_optimizer('tf2')
linear_model = tf.compat.v1.keras.experimental.LinearModel()
linear_model.compile(loss='mse', optimizer=optimizer, metrics=['accuracy']), y_train, epochs=10, verbose=0)
dnn_model = tf.keras.models.Sequential(
[tf.keras.layers.Dense(128, activation='relu'),
dnn_model.compile(loss='mse', optimizer=optimizer, metrics=['accuracy'])
combined_model = tf.compat.v1.keras.experimental.WideDeepModel(linear_model,
optimizer=[optimizer, optimizer], loss='mse', metrics=['accuracy'])[x_train, x_train], y_train, epochs=10)
combined_model.evaluate(x_eval, y_eval, return_dict=True)
Epoch 1/10 20/20 [==============================] - 0s 3ms/step - loss: 690.1404 - accuracy: 0.5407 Epoch 2/10 20/20 [==============================] - 0s 2ms/step - loss: 0.4099 - accuracy: 0.6826 Epoch 3/10 20/20 [==============================] - 0s 3ms/step - loss: 0.2995 - accuracy: 0.6842 Epoch 4/10 20/20 [==============================] - 0s 2ms/step - loss: 0.3216 - accuracy: 0.7097 Epoch 5/10 20/20 [==============================] - 0s 2ms/step - loss: 0.1901 - accuracy: 0.7512 Epoch 6/10 20/20 [==============================] - 0s 2ms/step - loss: 0.1709 - accuracy: 0.7687 Epoch 7/10 20/20 [==============================] - 0s 3ms/step - loss: 0.1696 - accuracy: 0.7911 Epoch 8/10 20/20 [==============================] - 0s 3ms/step - loss: 0.1612 - accuracy: 0.7911 Epoch 9/10 20/20 [==============================] - 0s 2ms/step - loss: 0.1543 - accuracy: 0.7974 Epoch 10/10 20/20 [==============================] - 0s 2ms/step - loss: 0.1520 - accuracy: 0.8070 9/9 [==============================] - 0s 2ms/step - loss: 0.2121 - accuracy: 0.7045 {'loss': 0.212116077542305, 'accuracy': 0.7045454382896423}
例 4: BoostedTreesEstimator からの移行
TensorFlow 1: BoostedTreesEstimator の使用
TensorFlow 1 では、tf.estimator.BoostedTreesEstimator
を使用してベースラインを作成し、回帰および分類問題のデシジョンツリーのアンサンブルを使用してベースライン勾配ブースティングモデルを作成できました。この機能は、TensorFlow 2 には含まれなくなりました。
bt_estimator = tf1.estimator.BoostedTreesEstimator(
bt_estimator.train(input_fn=_input_fn, steps=1000)
bt_estimator.evaluate(input_fn=_eval_input_fn, steps=100)
TensorFlow 2: TensorFlow Decision Forests の使用
TensorFlow 2 では、tf.estimator.BoostedTreesEstimator
TensorFlow Decision Forests パッケージの tfdf.keras.GradientBoostedTreesModel に置き換えられました。
TensorFlow Decision Forests は、tf.estimator.BoostedTreesEstimator
に比べて、特に品質、速度、使いやすさ、および柔軟性に関してさまざまな利点を提供します。TensorFlow Decision Forests について学ぶには、初心者のための colab から始めてください。
次の例は、TensorFlow 2 を使用して勾配ブーストツリーモデルをトレーニングする方法を示しています。
TensorFlow Decision Forests のインストール
pip install tensorflow_decision_forests
TensorFlow データセットを作成します。Decision Forests は多くの種類の特徴量をネイティブにサポートしており、前処理を必要としないことに注意してください。
train_dataframe = pd.read_csv('')
eval_dataframe = pd.read_csv('')
# Convert the Pandas Dataframes into TensorFlow datasets.
train_dataset = tfdf.keras.pd_dataframe_to_tf_dataset(train_dataframe, label="survived")
eval_dataset = tfdf.keras.pd_dataframe_to_tf_dataset(eval_dataframe, label="survived")
# Use the default hyper-parameters of the model.
gbt_model = tfdf.keras.GradientBoostedTreesModel()
gbt_evaluation = gbt_model.evaluate(eval_dataset, return_dict=True)
1/1 [==============================] - 0s 295ms/step - loss: 0.0000e+00 - accuracy: 0.8295 {'loss': 0.0, 'accuracy': 0.8295454382896423}
勾配ブーストツリーは、TensorFlow Decision Forests で利用できる多くのデシジョンフォレストアルゴリズムの 1 つにすぎません。たとえば、Random Forests(tfdf.keras.GradientBoostedTreesModel として利用可能であり、オーバーフィッティングに対して非常に耐性があります)に対して、CART(tfdf.keras.CartModel として利用可能)はモデルの解釈に最適です。
次の例では、Random Forest モデルをトレーニングしてプロットします。
# Train a Random Forest model
rf_model = tfdf.keras.RandomForestModel()
# Evaluate the Random Forest model
rf_evaluation = rf_model.evaluate(eval_dataset, return_dict=True)
最後の例では、CART モデルをトレーニングして評価します。
# Train a CART model
cart_model = tfdf.keras.CartModel()
# Plot the CART model
tfdf.model_plotter.plot_model_in_colab(cart_model, max_depth=2)
