انتقال صرفه جویی در ایست بازرسی

ذخیره مداوم "بهترین" مدل یا وزن / پارامترهای مدل مزایای زیادی دارد. اینها شامل امکان ردیابی پیشرفت آموزش و بارگیری مدل های ذخیره شده از حالت های مختلف ذخیره شده است.

در TensorFlow 1، برای پیکربندی ذخیره بازرسی در حین آموزش/اعتبار با APIهای tf.estimator.Estimator ، یک برنامه زمانی در tf.estimator.RunConfig مشخص می‌کنید یا از tf.estimator.CheckpointSaverHook استفاده می‌کنید. این راهنما نحوه مهاجرت از این گردش کار به APIهای TensorFlow 2 Keras را نشان می دهد.

در TensorFlow 2، می توانید tf.keras.callbacks.ModelCheckpoint را به چند روش پیکربندی کنید:

  • "بهترین" نسخه را بر اساس یک متریک نظارت شده با استفاده از پارامتر save_best_only=True ذخیره کنید، جایی که monitor می تواند به عنوان مثال 'loss' ، 'val_loss' ، 'accuracy', or "val_accuracy" باشد.
  • به طور مداوم در یک فرکانس خاص (با استفاده از آرگومان save_freq ) ذخیره کنید.
  • با تنظیم save_weights_only روی True ، وزن ها/پارامترها را فقط به جای کل مدل ذخیره کنید.

برای جزئیات بیشتر، به اسناد tf.keras.callbacks.ModelCheckpoint API و بخش Save checkpoints در هنگام آموزش در آموزش Save and load models مراجعه کنید. درباره قالب Checkpoint در بخش قالب TF Checkpoint در راهنمای Save and load models Keras بیشتر بیاموزید. علاوه بر این، برای افزودن تحمل خطا، می‌توانید از tf.keras.callbacks.BackupAndRestore یا tf.train.Checkpoint برای بررسی دستی استفاده کنید. در راهنمای انتقال تحمل خطا بیشتر بیاموزید.

فراخوانی Keras اشیایی هستند که در نقاط مختلف در حین آموزش/ارزیابی/پیش‌بینی در APIهای داخلی Keras Model.fit / Model.evaluate / Model.predict فراخوانی می‌شوند. در قسمت مراحل بعدی در انتهای راهنما بیشتر بیاموزید.


با واردات و یک مجموعه داده ساده برای اهداف نمایشی شروع کنید:

import tensorflow.compat.v1 as tf1
import tensorflow as tf
import numpy as np
import tempfile
mnist = tf.keras.datasets.mnist

(x_train, y_train),(x_test, y_test) = mnist.load_data()
, x_test = x_train / 255.0, x_test / 255.0
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/mnist.npz
11493376/11490434 [==============================] - 0s 0us/step
11501568/11490434 [==============================] - 0s 0us/step

TensorFlow 1: نقاط بازرسی را با tf.estimator API ذخیره کنید

این مثال TensorFlow 1 نحوه پیکربندی tf.estimator.RunConfig را برای ذخیره چک پوینت ها در هر مرحله در طول آموزش/ارزیابی با API های tf.estimator.Estimator می دهد:

feature_columns = [tf1.feature_column.numeric_column("x", shape=[28, 28])]

= tf1.estimator.RunConfig(save_summary_steps=1,

= tempfile.mkdtemp()

= tf1.estimator.DNNClassifier(
=[256, 32],
= config

= tf1.estimator.inputs.numpy_input_fn(
={"x": x_train},

= tf1.estimator.inputs.numpy_input_fn(
={"x": x_test},

= tf1.estimator.TrainSpec(input_fn=train_input_fn, max_steps=10)
= tf1.estimator.EvalSpec(input_fn=test_input_fn,

INFO:tensorflow:Using config: {'_model_dir': '/tmp/tmplrkjo9in', '_tf_random_seed': None, '_save_summary_steps': 1, '_save_checkpoints_steps': 1, '_save_checkpoints_secs': None, '_session_config': allow_soft_placement: true
%ls {classifier.model_dir}

TensorFlow 2: نقاط بازرسی را با یک فراخوان Keras برای Model.fit ذخیره کنید

در TensorFlow 2، زمانی که از Keras Model.fit (یا Model.evaluate ) داخلی برای آموزش/ارزیابی استفاده می کنید، می توانید tf.keras.callbacks.ModelCheckpoint را پیکربندی کنید و سپس آن را به پارامتر callbacks در Model.fit (یا Model.evaluate ). (در اسناد API و بخش Using callbacks در آموزش و ارزیابی با راهنمای روش های داخلی بیشتر بیاموزید.)

در مثال زیر، شما از یک پاسخ تماس tf.keras.callbacks.ModelCheckpoint برای ذخیره چک پوینت ها در یک دایرکتوری موقت استفاده خواهید کرد:

def create_model():
return tf.keras.models.Sequential([
.keras.layers.Flatten(input_shape=(28, 28)),
.keras.layers.Dense(512, activation='relu'),
.keras.layers.Dense(10, activation='softmax')

= create_model()

= tempfile.mkdtemp()

= tf.keras.callbacks.ModelCheckpoint(

=(x_test, y_test),
Epoch 1/10
1840/1875 [============================>.] - ETA: 0s - loss: 0.2224 - accuracy: 0.9348
2022-01-14 02:28:56.714889: W tensorflow/python/util/util.cc:368] Sets are not currently considered sequences, but this may change in the future, so consider avoiding using them.
INFO:tensorflow:Assets written to: /tmp/tmpb85suru4/assets
1875/1875 [==============================] - 4s 2ms/step - loss: 0.2208 - accuracy: 0.9354 - val_loss: 0.1132 - val_accuracy: 0.9669
Epoch 2/10
1870/1875 [============================>.] - ETA: 0s - loss: 0.0961 - accuracy: 0.9706INFO:tensorflow:Assets written to: /tmp/tmpb85suru4/assets
1875/1875 [==============================] - 3s 1ms/step - loss: 0.0962 - accuracy: 0.9706 - val_loss: 0.0784 - val_accuracy: 0.9753
Epoch 3/10
1860/1875 [============================>.] - ETA: 0s - loss: 0.0696 - accuracy: 0.9781INFO:tensorflow:Assets written to: /tmp/tmpb85suru4/assets
1875/1875 [==============================] - 3s 2ms/step - loss: 0.0695 - accuracy: 0.9782 - val_loss: 0.0684 - val_accuracy: 0.9788
Epoch 4/10
1860/1875 [============================>.] - ETA: 0s - loss: 0.0529 - accuracy: 0.9826INFO:tensorflow:Assets written to: /tmp/tmpb85suru4/assets
1875/1875 [==============================] - 3s 1ms/step - loss: 0.0531 - accuracy: 0.9826 - val_loss: 0.0671 - val_accuracy: 0.9791
Epoch 5/10
1860/1875 [============================>.] - ETA: 0s - loss: 0.0423 - accuracy: 0.9860INFO:tensorflow:Assets written to: /tmp/tmpb85suru4/assets
1875/1875 [==============================] - 3s 1ms/step - loss: 0.0424 - accuracy: 0.9860 - val_loss: 0.0772 - val_accuracy: 0.9757
Epoch 6/10
1860/1875 [============================>.] - ETA: 0s - loss: 0.0345 - accuracy: 0.9888INFO:tensorflow:Assets written to: /tmp/tmpb85suru4/assets
1875/1875 [==============================] - 3s 1ms/step - loss: 0.0345 - accuracy: 0.9888 - val_loss: 0.0669 - val_accuracy: 0.9811
Epoch 7/10
1860/1875 [============================>.] - ETA: 0s - loss: 0.0314 - accuracy: 0.9895INFO:tensorflow:Assets written to: /tmp/tmpb85suru4/assets
1875/1875 [==============================] - 3s 1ms/step - loss: 0.0313 - accuracy: 0.9895 - val_loss: 0.0718 - val_accuracy: 0.9800
Epoch 8/10
1870/1875 [============================>.] - ETA: 0s - loss: 0.0298 - accuracy: 0.9899INFO:tensorflow:Assets written to: /tmp/tmpb85suru4/assets
1875/1875 [==============================] - 3s 1ms/step - loss: 0.0298 - accuracy: 0.9899 - val_loss: 0.0632 - val_accuracy: 0.9825
Epoch 9/10
1860/1875 [============================>.] - ETA: 0s - loss: 0.0230 - accuracy: 0.9925INFO:tensorflow:Assets written to: /tmp/tmpb85suru4/assets
1875/1875 [==============================] - 3s 1ms/step - loss: 0.0231 - accuracy: 0.9924 - val_loss: 0.0748 - val_accuracy: 0.9800
Epoch 10/10
1860/1875 [============================>.] - ETA: 0s - loss: 0.0220 - accuracy: 0.9920INFO:tensorflow:Assets written to: /tmp/tmpb85suru4/assets
1875/1875 [==============================] - 3s 1ms/step - loss: 0.0222 - accuracy: 0.9920 - val_loss: 0.0703 - val_accuracy: 0.9825
<keras.callbacks.History at 0x7f638c204410>
%ls {model_checkpoint_callback.filepath}
assets/  keras_metadata.pb  saved_model.pb  variables/

مراحل بعدی

درباره ایست بازرسی بیشتر بدانید در:

در مورد پاسخ به تماس بیشتر بیاموزید:

همچنین ممکن است منابع مرتبط با مهاجرت زیر را مفید بدانید: