प्रशिक्षण के दौरान किसी मॉडल को सहेजना और लोड करना आम बात है। केरस मॉडल को सहेजने और लोड करने के लिए एपीआई के दो सेट हैं: एक उच्च-स्तरीय एपीआई और एक निम्न-स्तरीय एपीआई। यह ट्यूटोरियल दर्शाता है कि tf.distribute.Strategy का उपयोग करते समय आप tf.distribute.Strategy
API का उपयोग कैसे कर सकते हैं। सामान्य रूप से सहेजे गए मॉडल और क्रमांकन के बारे में जानने के लिए, कृपया सहेजे गए मॉडल मार्गदर्शिका और केरस मॉडल क्रमांकन मार्गदर्शिका पढ़ें। आइए एक साधारण उदाहरण से शुरू करें:
आयात निर्भरताएँ:
import tensorflow_datasets as tfds
import tensorflow as tf
का उपयोग करके डेटा और मॉडल तैयार करें:
mirrored_strategy = tf.distribute.MirroredStrategy()
def get_data():
datasets, ds_info = tfds.load(name='mnist', with_info=True, as_supervised=True)
mnist_train, mnist_test = datasets['train'], datasets['test']
BATCH_SIZE = BATCH_SIZE_PER_REPLICA * mirrored_strategy.num_replicas_in_sync
def scale(image, label):
image = tf.cast(image, tf.float32)
image /= 255
return image, label
train_dataset = mnist_train.map(scale).cache().shuffle(BUFFER_SIZE).batch(BATCH_SIZE)
eval_dataset = mnist_test.map(scale).batch(BATCH_SIZE)
return train_dataset, eval_dataset
def get_model():
with mirrored_strategy.scope():
model = tf.keras.Sequential([
tf.keras.layers.Conv2D(32, 3, activation='relu', input_shape=(28, 28, 1)),
tf.keras.layers.Dense(64, activation='relu'),
return model
INFO:tensorflow:Using MirroredStrategy with devices ('/job:localhost/replica:0/task:0/device:GPU:0',)
मॉडल को प्रशिक्षित करें:
model = get_model()
train_dataset, eval_dataset = get_data()
model.fit(train_dataset, epochs=2)
Epoch 1/2 938/938 [==============================] - 11s 5ms/step - loss: 0.1873 - sparse_categorical_accuracy: 0.9451 Epoch 2/2 938/938 [==============================] - 3s 3ms/step - loss: 0.0641 - sparse_categorical_accuracy: 0.9807 <keras.callbacks.History at 0x7f3b900396d0>
मॉडल को सहेजें और लोड करें
अब जबकि आपके पास काम करने के लिए एक सरल मॉडल है, तो आइए सेविंग/लोडिंग एपीआई पर एक नजर डालते हैं। एपीआई के दो सेट उपलब्ध हैं:
- उच्च स्तरीय keras
- निम्न स्तर
केरस एपीआई
केरस एपीआई के साथ एक मॉडल को सहेजने और लोड करने का एक उदाहरण यहां दिया गया है:
keras_model_path = "/tmp/keras_save"
2022-01-26 05:41:26.593570: W tensorflow/python/util/util.cc:368] Sets are not currently considered sequences, but this may change in the future, so consider avoiding using them. INFO:tensorflow:Assets written to: /tmp/keras_save/assets INFO:tensorflow:Assets written to: /tmp/keras_save/assets
के बिना मॉडल को पुनर्स्थापित करें:
restored_keras_model = tf.keras.models.load_model(keras_model_path)
restored_keras_model.fit(train_dataset, epochs=2)
Epoch 1/2 938/938 [==============================] - 3s 3ms/step - loss: 0.0476 - sparse_categorical_accuracy: 0.9859 Epoch 2/2 938/938 [==============================] - 3s 3ms/step - loss: 0.0334 - sparse_categorical_accuracy: 0.9895 <keras.callbacks.History at 0x7f3b187b7150>
मॉडल को पुनर्स्थापित करने के बाद, आप उस पर प्रशिक्षण जारी रख सकते हैं, यहां तक कि compile()
को फिर से कॉल करने की आवश्यकता के बिना, क्योंकि यह पहले से ही सहेजने से पहले संकलित है। मॉडल TensorFlow के मानक SavedModel
प्रोटो प्रारूप में सहेजा गया है। अधिक जानकारी के लिए, कृपया saved_model
प्रारूप की मार्गदर्शिका देखें।
अब मॉडल को लोड करने और इसे tf.distribute.Strategy
का उपयोग करके प्रशिक्षित करने के लिए:
another_strategy = tf.distribute.OneDeviceStrategy("/cpu:0")
with another_strategy.scope():
restored_keras_model_ds = tf.keras.models.load_model(keras_model_path)
restored_keras_model_ds.fit(train_dataset, epochs=2)
Epoch 1/2 2022-01-26 05:41:33.036733: W tensorflow/core/grappler/optimizers/data/auto_shard.cc:547] The `assert_cardinality` transformation is currently not handled by the auto-shard rewrite and will be removed. 2022-01-26 05:41:33.083001: W tensorflow/core/framework/dataset.cc:768] Input of GeneratorDatasetOp::Dataset will not be optimized because the dataset does not implement the AsGraphDefInternal() method needed to apply optimizations. 938/938 [==============================] - 10s 10ms/step - loss: 0.0474 - sparse_categorical_accuracy: 0.9860 Epoch 2/2 938/938 [==============================] - 10s 10ms/step - loss: 0.0327 - sparse_categorical_accuracy: 0.9903
जैसा कि आप देख सकते हैं, लोडिंग tf.distribute.Strategy
के साथ अपेक्षित रूप से काम करता है। जरूरी नहीं कि यहां इस्तेमाल की जाने वाली रणनीति बचत करने से पहले इस्तेमाल की गई रणनीति ही हो।
अब निचले स्तर के एपीआई पर एक नजर डालते हैं। मॉडल को सहेजना केरस एपीआई के समान है:
model = get_model() # get a fresh model
saved_model_path = "/tmp/tf_save"
tf.saved_model.save(model, saved_model_path)
INFO:tensorflow:Assets written to: /tmp/tf_save/assets INFO:tensorflow:Assets written to: /tmp/tf_save/assets
लोडिंग tf.saved_model.load()
के साथ की जा सकती है। हालाँकि, चूंकि यह एक एपीआई है जो निचले स्तर पर है (और इसलिए इसमें उपयोग के मामलों की एक विस्तृत श्रृंखला है), यह एक केरस मॉडल नहीं लौटाता है। इसके बजाय, यह एक ऐसी वस्तु देता है जिसमें ऐसे कार्य होते हैं जिनका उपयोग अनुमान लगाने के लिए किया जा सकता है। उदाहरण के लिए:
DEFAULT_FUNCTION_KEY = "serving_default"
loaded = tf.saved_model.load(saved_model_path)
inference_func = loaded.signatures[DEFAULT_FUNCTION_KEY]
लोड किए गए ऑब्जेक्ट में कई फ़ंक्शन हो सकते हैं, जिनमें से प्रत्येक एक कुंजी से जुड़ा होता है। सहेजे गए केरस मॉडल के साथ अनुमान फ़ंक्शन के लिए "serving_default"
डिफ़ॉल्ट कुंजी है। इस फ़ंक्शन के साथ एक अनुमान लगाने के लिए:
predict_dataset = eval_dataset.map(lambda image, label: image)
for batch in predict_dataset.take(1):
8.22724327e-02, -1.14511400e-01, 1.57513067e-01, 5.22858277e-02, 2.13724375e-03, 3.15639377e-02, 2.08704025e-01], [-1.46687120e-01, -1.10313833e-01, -1.16352811e-02, -1.44550815e-01, 2.09794566e-02, 1.47883072e-02, 3.96856442e-02, -2.15019658e-03, -4.90810722e-02, 1.34708211e-01], [-2.02591017e-01, -2.29728431e-01, 6.73423260e-02, -1.24901496e-01, -1.38434023e-02, 8.64367038e-02, 1.22342721e-01, 1.67826824e-02, 1.65354639e-01, 1.83434993e-01], [-2.25799978e-01, -1.02682747e-01, 9.48531851e-02, -9.38871950e-02, 1.03806734e-01, 2.04695478e-01, 8.09893832e-02, -1.45416632e-02, 1.33486420e-01, -6.27665371e-02], [-1.19375348e-01, 2.23235339e-02, 1.04302749e-01, -1.11149743e-01, 6.12434298e-02, 6.89433664e-02, 2.08741099e-01, -3.81497070e-02, -1.42122135e-02, 7.65201449e-03]], dtype=float32)>} 2022-01-26 05:41:53.590742: W tensorflow/core/kernels/data/cache_dataset_ops.cc:768] The calling iterator did not fully read the dataset being cached. In order to avoid unexpected truncation of the dataset, the partially cached contents of the dataset will be discarded. This can happen if you have an input pipeline similar to `dataset.cache().take(k).repeat()`. You should use `dataset.take(k).cache().repeat()` instead.
आप वितरित तरीके से अनुमान भी लोड और कर सकते हैं:
another_strategy = tf.distribute.MirroredStrategy()
with another_strategy.scope():
loaded = tf.saved_model.load(saved_model_path)
inference_func = loaded.signatures[DEFAULT_FUNCTION_KEY]
dist_predict_dataset = another_strategy.experimental_distribute_dataset(
# Calling the function in a distributed manner
for batch in dist_predict_dataset:
INFO:tensorflow:Using MirroredStrategy with devices ('/job:localhost/replica:0/task:0/device:GPU:0',)
पुनर्स्थापित फ़ंक्शन को कॉल करना सहेजे गए मॉडल (भविष्यवाणी) पर केवल एक आगे का पास है। क्या होगा यदि आप लोड किए गए फ़ंक्शन का प्रशिक्षण जारी रखना चाहते हैं? या लोड किए गए फ़ंक्शन को एक बड़े मॉडल में एम्बेड करें? इसे प्राप्त करने के लिए इस भरी हुई वस्तु को केरस परत में लपेटना एक आम बात है। सौभाग्य से, TF हब में इस उद्देश्य के लिए हब.केरसलेयर है, जो यहाँ दिखाया गया है:
import tensorflow_hub as hub
def build_model(loaded):
x = tf.keras.layers.Input(shape=(28, 28, 1), name='input_x')
# Wrap what's loaded to a KerasLayer
keras_layer = hub.KerasLayer(loaded, trainable=True)(x)
model = tf.keras.Model(x, keras_layer)
return model
another_strategy = tf.distribute.MirroredStrategy()
with another_strategy.scope():
loaded = tf.saved_model.load(saved_model_path)
model = build_model(loaded)
model.fit(train_dataset, epochs=2)
INFO:tensorflow:Using MirroredStrategy with devices ('/job:localhost/replica:0/task:0/device:GPU:0',) Epoch 1/2 938/938 [==============================] - 6s 3ms/step - loss: 0.1910 - sparse_categorical_accuracy: 0.9442 Epoch 2/2 938/938 [==============================] - 3s 4ms/step - loss: 0.0633 - sparse_categorical_accuracy: 0.9813
जैसा कि आप देख सकते हैं, hub.KerasLayer
से वापस लोड किए गए परिणाम को एक Keras परत में लपेटता है जिसका उपयोग किसी अन्य मॉडल के निर्माण के लिए किया जा सकता है। यह ट्रांसफर लर्निंग के लिए बहुत उपयोगी है।
मुझे किस एपीआई का उपयोग करना चाहिए?
बचत के लिए, यदि आप केरस मॉडल के साथ काम कर रहे हैं, तो लगभग हमेशा केरस के मॉडल.सेव model.save()
एपीआई का उपयोग करने की सिफारिश की जाती है। यदि आप जो सहेज रहे हैं वह केरस मॉडल नहीं है, तो निचले स्तर का एपीआई आपकी एकमात्र पसंद है।
लोडिंग के लिए, आप किस एपीआई का उपयोग करते हैं यह इस बात पर निर्भर करता है कि आप लोडिंग एपीआई से क्या प्राप्त करना चाहते हैं। यदि आप केरस मॉडल प्राप्त नहीं कर सकते (या नहीं करना चाहते), तो tf.saved_model.load()
का उपयोग करें। अन्यथा, tf.keras.models.load_model()
का उपयोग करें। ध्यान दें कि आप केरस मॉडल को तभी वापस पा सकते हैं जब आपने केरस मॉडल को सहेजा हो।
एपीआई को मिक्स एंड मैच करना संभव है। आप एक केरस मॉडल को model.save
के साथ सहेज सकते हैं, और निम्न-स्तरीय एपीआई, tf.saved_model.load
के साथ एक गैर-केरस मॉडल लोड कर सकते हैं।
model = get_model()
# Saving the model using Keras's save() API
another_strategy = tf.distribute.MirroredStrategy()
# Loading the model using lower level API
with another_strategy.scope():
loaded = tf.saved_model.load(keras_model_path)
INFO:tensorflow:Assets written to: /tmp/keras_save/assets INFO:tensorflow:Using MirroredStrategy with devices ('/job:localhost/replica:0/task:0/device:GPU:0',)
स्थानीय डिवाइस से सहेजना/लोड करना
दूरस्थ रूप से चलते समय स्थानीय आईओ डिवाइस से सहेजते और लोड करते समय, उदाहरण के लिए क्लाउड टीपीयू का उपयोग करते हुए, आईओ डिवाइस को लोकलहोस्ट पर सेट करने के लिए विकल्प experimental_io_device
का उपयोग किया जाना चाहिए।
model = get_model()
# Saving the model to a path on localhost.
saved_model_path = "/tmp/tf_save"
save_options = tf.saved_model.SaveOptions(experimental_io_device='/job:localhost')
model.save(saved_model_path, options=save_options)
# Loading the model from a path on localhost.
another_strategy = tf.distribute.MirroredStrategy()
with another_strategy.scope():
load_options = tf.saved_model.LoadOptions(experimental_io_device='/job:localhost')
loaded = tf.keras.models.load_model(saved_model_path, options=load_options)
INFO:tensorflow:Assets written to: /tmp/tf_save/assets INFO:tensorflow:Using MirroredStrategy with devices ('/job:localhost/replica:0/task:0/device:GPU:0',)
एक विशेष मामला तब होता है जब आपके पास केरस मॉडल होता है जिसमें अच्छी तरह से परिभाषित इनपुट नहीं होते हैं। उदाहरण के लिए, एक अनुक्रमिक मॉडल बिना किसी इनपुट आकार के बनाया जा सकता है ( Sequential([Dense(3), ...]
)। उप-वर्गीकृत मॉडल में आरंभीकरण के बाद भी अच्छी तरह से परिभाषित इनपुट नहीं होते हैं। इस मामले में, आपको साथ रहना चाहिए बचत और लोडिंग दोनों पर निचले स्तर के एपीआई, अन्यथा आपको एक त्रुटि मिलेगी।
यह जांचने के लिए कि क्या आपके मॉडल में अच्छी तरह से परिभाषित इनपुट हैं, बस जांचें कि क्या model.inputs
है। यदि यह None
है, तो आप सभी अच्छे हैं। इनपुट आकार स्वचालित रूप से परिभाषित होते हैं जब मॉडल का उपयोग .fit
, .evaluate
, .predict
, या मॉडल ( model(inputs)
) को कॉल करते समय किया जाता है।
यहाँ एक उदाहरण है:
class SubclassedModel(tf.keras.Model):
output_name = 'output_layer'
def __init__(self):
super(SubclassedModel, self).__init__()
self._dense_layer = tf.keras.layers.Dense(
5, dtype=tf.dtypes.float32, name=self.output_name)
def call(self, inputs):
return self._dense_layer(inputs)
my_model = SubclassedModel()
# my_model.save(keras_model_path) # ERROR!
tf.saved_model.save(my_model, saved_model_path)
WARNING:tensorflow:Skipping full serialization of Keras layer <__main__.SubclassedModel object at 0x7f3ad00f3510>, because it is not built. WARNING:tensorflow:Skipping full serialization of Keras layer <keras.layers.core.dense.Dense object at 0x7f3ad00f3e90>, because it is not built. INFO:tensorflow:Assets written to: /tmp/tf_save/assets