Lưu và tải mô hình

Tiến trình của mô hình có thể được lưu trong và sau khi đào tạo. Điều này có nghĩa là một mô hình có thể tiếp tục lại khi nó đã dừng lại và tránh thời gian đào tạo dài. Lưu cũng có nghĩa là bạn có thể chia sẻ mô hình của mình và những người khác có thể tạo lại tác phẩm của bạn. Khi xuất bản các mô hình và kỹ thuật nghiên cứu, hầu hết các học viên học máy đều chia sẻ:

  • mã để tạo mô hình và
  • trọng lượng hoặc thông số được đào tạo cho mô hình

Chia sẻ dữ liệu này giúp những người khác hiểu cách hoạt động của mô hình và tự mình thử với dữ liệu mới.

Tùy chọn

Có nhiều cách khác nhau để lưu các mô hình TensorFlow tùy thuộc vào API bạn đang sử dụng. Hướng dẫn này sử dụng tf.keras , một API cấp cao để xây dựng và đào tạo các mô hình trong TensorFlow. Đối với các cách tiếp cận khác, hãy xem hướng dẫn Lưu và khôi phục TensorFlow hoặc Lưu trong háo hức .

Thành lập

Cài đặt và nhập

Cài đặt và nhập TensorFlow và các phụ thuộc:

pip install pyyaml h5py  # Required to save models in HDF5 format
import os

import tensorflow as tf
from tensorflow import keras


Lấy một tập dữ liệu mẫu

Để trình bày cách lưu và tải trọng số, bạn sẽ sử dụng tập dữ liệu MNIST . Để tăng tốc những lần chạy này, hãy sử dụng 1000 ví dụ đầu tiên:

(train_images, train_labels), (test_images, test_labels) = tf.keras.datasets.mnist.load_data()

train_labels = train_labels[:1000]
test_labels = test_labels[:1000]

train_images = train_images[:1000].reshape(-1, 28 * 28) / 255.0
test_images = test_images[:1000].reshape(-1, 28 * 28) / 255.0

Xác định một mô hình

Bắt đầu bằng cách xây dựng một mô hình tuần tự đơn giản:

# Define a simple sequential model
def create_model():
  model = tf.keras.models.Sequential([
    keras.layers.Dense(512, activation='relu', input_shape=(784,)),


  return model

# Create a basic model instance
model = create_model()

# Display the model's architecture
Model: "sequential"
 Layer (type)                Output Shape              Param #   
 dense (Dense)               (None, 512)               401920    
 dropout (Dropout)           (None, 512)               0         
 dense_1 (Dense)             (None, 10)                5130      
Total params: 407,050
Trainable params: 407,050
Non-trainable params: 0

Lưu các điểm kiểm tra trong quá trình đào tạo

Bạn có thể sử dụng một mô hình đã được đào tạo mà không cần phải đào tạo lại hoặc tiếp tục đào tạo từ nơi bạn đã dừng lại trong trường hợp quá trình đào tạo bị gián đoạn. Lệnh gọi lại tf.keras.callbacks.ModelCheckpoint cho phép bạn liên tục lưu mô hình cả trong và khi kết thúc đào tạo.

Sử dụng cuộc gọi lại của Checkpoint

Tạo lệnh gọi lại tf.keras.callbacks.ModelCheckpoint để tiết kiệm trọng lượng chỉ trong quá trình đào tạo:

checkpoint_path = "training_1/cp.ckpt"
checkpoint_dir = os.path.dirname(checkpoint_path)

# Create a callback that saves the model's weights
cp_callback = tf.keras.callbacks.ModelCheckpoint(filepath=checkpoint_path,

# Train the model with the new callback
          validation_data=(test_images, test_labels),
          callbacks=[cp_callback])  # Pass callback to training

# This may generate warnings related to saving the state of the optimizer.
# These warnings (and similar warnings throughout this notebook)
# are in place to discourage outdated usage, and can be ignored.
<keras.callbacks.History at 0x7eff8d865390>

Điều này tạo ra một bộ sưu tập các tệp điểm kiểm tra TensorFlow được cập nhật vào cuối mỗi kỷ nguyên:

['checkpoint', 'cp.ckpt.index', 'cp.ckpt.data-00000-of-00001']

Miễn là hai mô hình có cùng kiến ​​trúc, bạn có thể chia sẻ trọng số giữa chúng. Vì vậy, khi khôi phục một mô hình từ chỉ trọng số, hãy tạo một mô hình có cùng kiến ​​trúc với mô hình ban đầu và sau đó đặt trọng số của nó.

Bây giờ xây dựng lại một mô hình mới, chưa qua đào tạo và đánh giá nó trên bộ thử nghiệm. Một mô hình chưa được đào tạo sẽ hoạt động ở mức cơ hội (độ chính xác ~ 10%):

# Create a basic model instance
model = create_model()

# Evaluate the model
loss, acc = model.evaluate(test_images, test_labels, verbose=2)
print("Untrained model, accuracy: {:5.2f}%".format(100 * acc))
32/32 - 0s - loss: 2.4473 - sparse_categorical_accuracy: 0.0980 - 145ms/epoch - 5ms/step
Untrained model, accuracy:  9.80%

Sau đó tải trọng lượng từ điểm kiểm tra và đánh giá lại:

# Loads the weights

# Re-evaluate the model
loss, acc = model.evaluate(test_images, test_labels, verbose=2)
print("Restored model, accuracy: {:5.2f}%".format(100 * acc))
32/32 - 0s - loss: 0.4061 - sparse_categorical_accuracy: 0.8770 - 65ms/epoch - 2ms/step
Restored model, accuracy: 87.70%

Tùy chọn gọi lại điểm kiểm tra

Lệnh gọi lại cung cấp một số tùy chọn để cung cấp tên duy nhất cho các điểm kiểm tra và điều chỉnh tần suất điểm kiểm tra.

Đào tạo một mô hình mới và lưu các điểm kiểm tra được đặt tên duy nhất cứ sau năm kỷ nguyên một lần:

# Include the epoch in the file name (uses `str.format`)
checkpoint_path = "training_2/cp-{epoch:04d}.ckpt"
checkpoint_dir = os.path.dirname(checkpoint_path)

batch_size = 32

# Create a callback that saves the model's weights every 5 epochs
cp_callback = tf.keras.callbacks.ModelCheckpoint(

# Create a new model instance
model = create_model()

# Save the weights using the `checkpoint_path` format

# Train the model with the new callback
          validation_data=(test_images, test_labels),
<keras.callbacks.History at 0x7eff807703d0>

Bây giờ, hãy xem các điểm kiểm tra kết quả và chọn điểm kiểm tra mới nhất:

latest = tf.train.latest_checkpoint(checkpoint_dir)

Để kiểm tra, hãy đặt lại mô hình và tải điểm kiểm tra mới nhất:

# Create a new model instance
model = create_model()

# Load the previously saved weights

# Re-evaluate the model
loss, acc = model.evaluate(test_images, test_labels, verbose=2)
print("Restored model, accuracy: {:5.2f}%".format(100 * acc))
32/32 - 0s - loss: 0.4996 - sparse_categorical_accuracy: 0.8770 - 150ms/epoch - 5ms/step
Restored model, accuracy: 87.70%

Những tập tin này là gì?

Đoạn mã trên lưu trữ các trọng số vào một tập hợp các tệp được định dạng điểm kiểm tra chỉ chứa các trọng số được huấn luyện ở định dạng nhị phân. Các trạm kiểm soát bao gồm:

  • Một hoặc nhiều phân đoạn chứa trọng lượng mô hình của bạn.
  • Một tệp chỉ mục cho biết trọng số nào được lưu trữ trong phân đoạn nào.

Nếu bạn đang đào tạo một mô hình trên một máy duy nhất, bạn sẽ có một phân đoạn với hậu tố: .data-00000-of-00001

Lưu trọng lượng theo cách thủ công

Lưu trọng số theo cách thủ công với phương pháp Model.save_weights . Theo mặc định, tf.keras —và cụ thể là save_weights — sử dụng định dạng điểm kiểm tra TensorFlow với phần mở rộng .ckpt (lưu ở HDF5 với phần mở rộng .h5 được đề cập trong hướng dẫn mô hình Lưu và tuần tự hóa ):

# Save the weights

# Create a new model instance
model = create_model()

# Restore the weights

# Evaluate the model
loss, acc = model.evaluate(test_images, test_labels, verbose=2)
print("Restored model, accuracy: {:5.2f}%".format(100 * acc))
32/32 - 0s - loss: 0.4996 - sparse_categorical_accuracy: 0.8770 - 143ms/epoch - 4ms/step
Restored model, accuracy: 87.70%

Lưu toàn bộ mô hình

Gọi model.save để lưu kiến ​​trúc, trọng số và cấu hình đào tạo của mô hình trong một tệp / thư mục duy nhất. Điều này cho phép bạn xuất một mô hình để nó có thể được sử dụng mà không cần truy cập vào mã Python gốc *. Vì trạng thái trình tối ưu hóa được khôi phục, bạn có thể tiếp tục đào tạo từ chính xác nơi bạn đã dừng lại.

Toàn bộ mô hình có thể được lưu ở hai định dạng tệp khác nhau ( SavedModelHDF5 ). Định dạng TensorFlow SavedModel là định dạng tệp mặc định trong TF2.x. Tuy nhiên, các mô hình có thể được lưu ở định dạng HDF5 . Chi tiết hơn về cách lưu toàn bộ mô hình ở hai định dạng tệp được mô tả bên dưới.

Lưu một mô hình đầy đủ chức năng là rất hữu ích — bạn có thể tải chúng trong TensorFlow.js ( Mô hình đã lưu , HDF5 ), sau đó đào tạo và chạy chúng trong trình duyệt web hoặc chuyển đổi chúng để chạy trên thiết bị di động bằng TensorFlow Lite ( Mô hình đã lưu , HDF5 )

* Các đối tượng tùy chỉnh (ví dụ như các mô hình hoặc lớp phân lớp) yêu cầu đặc biệt chú ý khi lưu và tải. Xem phần Lưu đối tượng tùy chỉnh bên dưới

Định dạng SavedModel

Định dạng SavedModel là một cách khác để tuần tự hóa các mô hình. Các mô hình đã lưu ở định dạng này có thể được khôi phục bằng tf.keras.models.load_model và tương thích với TensorFlow Serving. Hướng dẫn SavedModel đi sâu vào chi tiết về cách phân phối / kiểm tra SavedModel. Phần bên dưới minh họa các bước để lưu và khôi phục mô hình.

# Create and train a new model instance.
model = create_model()
model.fit(train_images, train_labels, epochs=5)

# Save the entire model as a SavedModel.
!mkdir -p saved_model
INFO:tensorflow:Assets written to: saved_model/my_model/assets

Định dạng SavedModel là một thư mục chứa tệp nhị phân protobuf và điểm kiểm tra TensorFlow. Kiểm tra thư mục mô hình đã lưu:

# my_model directory
ls saved_model

# Contains an assets folder, saved_model.pb, and variables folder.
ls saved_model/my_model
assets  keras_metadata.pb  saved_model.pb  variables

Tải lại mô hình Keras mới từ mô hình đã lưu:

new_model = tf.keras.models.load_model('saved_model/my_model')

# Check its architecture
Model: "sequential_5"
 Layer (type)                Output Shape              Param #   
 dense_10 (Dense)            (None, 512)               401920    
 dropout_5 (Dropout)         (None, 512)               0         
 dense_11 (Dense)            (None, 10)                5130      
Total params: 407,050
Trainable params: 407,050
Non-trainable params: 0

Mô hình khôi phục được biên dịch với các đối số giống như mô hình ban đầu. Thử chạy đánh giá và dự đoán với mô hình đã tải:

# Evaluate the restored model
loss, acc = new_model.evaluate(test_images, test_labels, verbose=2)
print('Restored model, accuracy: {:5.2f}%'.format(100 * acc))

32/32 - 0s - loss: 0.4577 - sparse_categorical_accuracy: 0.8430 - 156ms/epoch - 5ms/step
Restored model, accuracy: 84.30%
(1000, 10)

Định dạng HDF5

Keras cung cấp một định dạng lưu cơ bản sử dụng tiêu chuẩn HDF5 .

# Create and train a new model instance.
model = create_model()
model.fit(train_images, train_labels, epochs=5)

# Save the entire model to a HDF5 file.
# The '.h5' extension indicates that the model should be saved to HDF5.
Bây giờ, hãy tạo lại mô hình từ tệp đó:

# Recreate the exact same model, including its weights and the optimizer
new_model = tf.keras.models.load_model('my_model.h5')

# Show the model architecture
Model: "sequential_6"
 Layer (type)                Output Shape              Param #   
 dense_12 (Dense)            (None, 512)               401920    
 dropout_6 (Dropout)         (None, 512)               0         
 dense_13 (Dense)            (None, 10)                5130      
Total params: 407,050
Trainable params: 407,050
Non-trainable params: 0

Kiểm tra độ chính xác của nó:

loss, acc = new_model.evaluate(test_images, test_labels, verbose=2)
print('Restored model, accuracy: {:5.2f}%'.format(100 * acc))
32/32 - 0s - loss: 0.4266 - sparse_categorical_accuracy: 0.8620 - 141ms/epoch - 4ms/step
Restored model, accuracy: 86.20%

Keras lưu các mô hình bằng cách kiểm tra kiến ​​trúc của chúng. Kỹ thuật này tiết kiệm mọi thứ:

  • Các giá trị trọng lượng
  • Kiến trúc của mô hình
  • Cấu hình đào tạo của mô hình (những gì bạn truyền cho phương thức .compile() )
  • Trình tối ưu hóa và trạng thái của nó, nếu có (điều này cho phép bạn bắt đầu lại quá trình đào tạo từ nơi bạn đã dừng lại)

Keras không thể lưu các trình tối ưu hóa v1.x (từ tf.compat.v1.train ) vì chúng không tương thích với các trạm kiểm soát. Đối với trình tối ưu hóa v1.x, bạn cần phải biên dịch lại mô hình sau khi tải — làm mất trạng thái của trình tối ưu hóa.

Lưu các đối tượng tùy chỉnh

Nếu bạn đang sử dụng định dạng SavedModel, bạn có thể bỏ qua phần này. Sự khác biệt chính giữa HDF5 và SavedModel là HDF5 sử dụng cấu hình đối tượng để lưu kiến ​​trúc mô hình, trong khi SavedModel lưu đồ thị thực thi. Do đó, SavedModels có thể lưu các đối tượng tùy chỉnh như mô hình lớp con và lớp tùy chỉnh mà không yêu cầu mã gốc.

Để lưu các đối tượng tùy chỉnh vào HDF5, bạn phải làm như sau:

  1. Xác định phương thức get_config trong đối tượng của bạn và tùy chọn một from_config .
    • get_config(self) trả về một từ điển JSON-serializable các tham số cần thiết để tạo lại đối tượng.
    • from_config(cls, config) sử dụng cấu hình trả về từ get_config để tạo một đối tượng mới. Theo mặc định, hàm này sẽ sử dụng cấu hình làm kwargs khởi tạo ( return cls(**config) ).
  2. Chuyển đối tượng đến đối số custom_objects khi tải mô hình. Đối số phải là một từ điển ánh xạ tên lớp chuỗi với lớp Python. Ví dụ: tf.keras.models.load_model(path, custom_objects={'CustomLayer': CustomLayer})

Xem hướng dẫn Viết các lớp và mô hình từ đầu để biết các ví dụ về các đối tượng tùy chỉnh và get_config .

