TPU एम्बेडिंग_कॉलम से TPUEएम्बेडिंग परत में माइग्रेट करें

यह मार्गदर्शिका दर्शाती है कि टीपीयू पर टीपीयू पर एम्बेडिंग प्रशिक्षण को टीपीयूएस्टिमेटर के साथ TPUEstimator के साथ embedding_column एपीआई से टीपीयूस्ट्रेटी के साथ TPUEmbedding लेयर एपीआई में कैसे माइग्रेट किया TPUStrategy

एम्बेडिंग (बड़े) मैट्रिसेस हैं। वे लुकअप टेबल हैं जो विरल फीचर स्पेस से घने वैक्टर तक मैप करते हैं। एम्बेडिंग कुशल और सघन प्रतिनिधित्व प्रदान करते हैं, जटिल समानताओं और सुविधाओं के बीच संबंधों को कैप्चर करते हैं।

TensorFlow में TPU पर प्रशिक्षण एम्बेडिंग के लिए विशेष समर्थन शामिल है। यह टीपीयू-विशिष्ट एम्बेडिंग समर्थन आपको एम्बेडिंग को प्रशिक्षित करने की अनुमति देता है जो एकल टीपीयू डिवाइस की मेमोरी से बड़ा होता है, और टीपीयू पर विरल और रैग्ड इनपुट का उपयोग करने के लिए।

  • TensorFlow 1 में, tf.compat.v1.estimator.tpu.TPUEstimator एक उच्च स्तरीय API है जो TPU के साथ सेवा के लिए प्रशिक्षण, मूल्यांकन, भविष्यवाणी और निर्यात को समाहित करता है। इसमें tf.compat.v1.tpu.experimental.embedding_column के लिए विशेष समर्थन है।
  • इसे TensorFlow 2 में लागू करने के लिए, TensorFlow Recommenders' tfrs.layers.embedding.TPUEmbedding परत का उपयोग करें। प्रशिक्षण और मूल्यांकन के लिए, tf.distribute.TPUStrategy वितरण रणनीति का उपयोग करें- tf.distribute.TPUStrategy- जो केरस एपीआई के साथ संगत है, उदाहरण के लिए, मॉडल बिल्डिंग ( tf.keras.Model ), ऑप्टिमाइज़र ( tf.keras.optimizers.Optimizer ), और या tf.function और tf.GradientTape के साथ एक कस्टम प्रशिक्षण लूप के साथ प्रशिक्षण।

अतिरिक्त जानकारी के लिए, अतिरिक्त जानकारी के लिए tfrs.layers.embedding.TPUEmbedding परत का API दस्तावेज़, साथ ही tf.tpu.experimental.embedding.TableConfig और tf.tpu.experimental.embedding.FeatureConfig दस्तावेज़ देखें। tf.distribute.TPUStrategy के अवलोकन के लिए, वितरित प्रशिक्षण मार्गदर्शिका और टीपीयू का उपयोग करें मार्गदर्शिका देखें। यदि आप TPUStrategy से TPUEstimator में माइग्रेट कर रहे हैं, तो TPU माइग्रेशन गाइड देखें।

सेट अप

TensorFlow अनुशंसाकर्ताओं को स्थापित करके और कुछ आवश्यक पैकेज आयात करके प्रारंभ करें:

pip install tensorflow-recommenders
import tensorflow as tf
import tensorflow.compat.v1 as tf1

# TPUEmbedding layer is not part of TensorFlow.
import tensorflow_recommenders as tfrs
और प्रदर्शन उद्देश्यों के लिए एक साधारण डेटासेट तैयार करें:

features = [[1., 1.5]]
= [[0, 0], [0, 1]]
= [0, 5]
= [[0.3]]
= [[4., 4.5]]
= [[0, 0], [0, 1]]
= [4, 3]
= [[0.8]]

TensorFlow 1: टीपीयू अनुमानक के साथ टीपीयू पर ट्रेन एम्बेडिंग

TensorFlow 1 में, आप tf.compat.v1.tpu.experimental.embedding_column API का उपयोग करके TPU एम्बेडिंग सेट करते हैं और tf.compat.v1.estimator.tpu.TPUEstimator के साथ TPU पर मॉडल का प्रशिक्षण/मूल्यांकन करते हैं।

इनपुट टीपीयू एम्बेडिंग टेबल के लिए शून्य से लेकर शब्दावली आकार तक के पूर्णांक हैं। इनपुट को tf.feature_column.categorical_column_with_identity के साथ श्रेणीबद्ध आईडी में एन्कोडिंग के साथ शुरू करें। key पैरामीटर के लिए "sparse_feature" का उपयोग करें, क्योंकि इनपुट सुविधाएं पूर्णांक-मूल्यवान हैं, जबकि num_buckets एम्बेडिंग तालिका ( 10 ) के लिए शब्दावली आकार है।

embedding_id_column = (
="sparse_feature", num_buckets=10))

इसके बाद, विरल श्रेणीबद्ध इनपुट को tpu.experimental.embedding_column के साथ सघन प्रतिनिधित्व में बदलें, जहां dimension एम्बेडिंग तालिका की चौड़ाई है। यह प्रत्येक num_buckets के लिए एक एम्बेडिंग वेक्टर संग्रहीत करेगा।

embedding_column = tf1.tpu.experimental.embedding_column(
, dimension=5)

अब, tf.estimator.tpu.experimental.EmbeddingConfigSpec के माध्यम से tf.estimator.tpu.experimental.EmbeddingConfigSpec विशिष्ट एम्बेडिंग कॉन्फ़िगरेशन को परिभाषित करें। आप इसे बाद में tf.estimator.tpu.TPUEstimator को एक embedding_config_spec पैरामीटर के रूप में पास करेंगे।

embedding_config_spec = tf1.estimator.tpu.experimental.EmbeddingConfigSpec(

अगला, TPUEstimator का उपयोग करने के लिए, परिभाषित करें:

  • प्रशिक्षण डेटा के लिए एक इनपुट फ़ंक्शन
  • मूल्यांकन डेटा के लिए एक मूल्यांकन इनपुट फ़ंक्शन
  • TPUEstimator को निर्देश देने के लिए एक मॉडल फ़ंक्शन कि कैसे सुविधाओं और लेबल के साथ प्रशिक्षण सेशन को परिभाषित किया जाता है
def _input_fn(params):
{"dense_feature": features,
"sparse_feature": tf1.SparseTensor(
, [1, 2])},
= dataset.repeat()
return dataset.batch(params['batch_size'], drop_remainder=True)

def _eval_input_fn(params):
{"dense_feature": eval_features,
"sparse_feature": tf1.SparseTensor(
, [1, 2])},
= dataset.repeat()
return dataset.batch(params['batch_size'], drop_remainder=True)

def _model_fn(features, labels, mode, params):
= tf1.keras.layers.DenseFeatures(embedding_column)(features)
= tf1.keras.layers.Concatenate(axis=1)(
[embedding_features, features["dense_feature"]])
= tf1.layers.Dense(1)(concatenated_features)
= tf1.losses.mean_squared_error(labels=labels, predictions=logits)
= tf1.train.AdagradOptimizer(0.05)
= tf1.tpu.CrossShardOptimizer(optimizer)
= optimizer.minimize(loss, global_step=tf1.train.get_global_step())
return tf1.estimator.tpu.TPUEstimatorSpec(mode, loss=loss, train_op=train_op)

परिभाषित उन कार्यों के साथ, एक tf.distribute.cluster_resolver.TPUClusterResolver बनाएं जो क्लस्टर जानकारी प्रदान करता है, और एक tf.compat.v1.estimator.tpu.RunConfig ऑब्जेक्ट।

आपके द्वारा परिभाषित मॉडल फ़ंक्शन के साथ, अब आप एक TPUEstimator बना सकते हैं। यहां, आप चेकपॉइंट बचत को छोड़ कर प्रवाह को सरल बनाएंगे। फिर, आप TPUEstimator के प्रशिक्षण और मूल्यांकन दोनों के लिए बैच आकार निर्दिष्ट करेंगे।

cluster_resolver = tf1.distribute.cluster_resolver.TPUClusterResolver(tpu='')
print("All devices: ", tf1.config.list_logical_devices('TPU'))
tpu_config = tf1.estimator.tpu.TPUConfig(
= tf1.estimator.tpu.RunConfig(
= tf1.estimator.tpu.TPUEstimator(
=_model_fn, config=config, train_batch_size=8, eval_batch_size=8,
फिर, मूल्यांकन डेटा का उपयोग करके मॉडल का मूल्यांकन करने के लिए TPUEstimator.evaluate पर कॉल करें:

estimator.evaluate(_eval_input_fn, steps=1)
TensorFlow 2: TPUStrategy के साथ TPU पर ट्रेन एम्बेडिंग

TensorFlow 2 में, TPU कार्यकर्ताओं को प्रशिक्षित करने के लिए, मॉडल परिभाषा और प्रशिक्षण/मूल्यांकन के लिए Keras API के साथ tf.distribute.TPUStrategy का उपयोग करें। (Keras और एक कस्टम ट्रेनिंग लूप ( tf.function और tf.GradientTape के साथ) के साथ प्रशिक्षण के अधिक उदाहरणों के लिए उपयोग TPU गाइड देखें।)

चूंकि आपको दूरस्थ क्लस्टर से कनेक्ट करने और TPU कार्यकर्ताओं को प्रारंभ करने के लिए कुछ आरंभीकरण कार्य करने की आवश्यकता है, क्लस्टर जानकारी प्रदान करने और क्लस्टर से कनेक्ट करने के लिए TPUClusterResolver बनाकर प्रारंभ करें। ( इस्तेमाल करें टीपीयू गाइड के टीपीयू इनिशियलाइज़ेशन सेक्शन में और जानें।)

cluster_resolver = tf.distribute.cluster_resolver.TPUClusterResolver(tpu='')
print("All devices: ", tf.config.list_logical_devices('TPU'))
इसके बाद, अपना डेटा तैयार करें। यह उसी तरह है जैसे आपने TensorFlow 1 उदाहरण में एक डेटासेट बनाया था, सिवाय इसके कि डेटासेट फ़ंक्शन को अब एक tf.distribute.InputContext ऑब्जेक्ट के बजाय एक params डिक्टेट पास किया गया है। आप इस ऑब्जेक्ट का उपयोग स्थानीय बैच आकार को निर्धारित करने के लिए कर सकते हैं (और यह पाइपलाइन किस होस्ट के लिए है, ताकि आप अपने डेटा को ठीक से विभाजित कर सकें)।

  • tfrs.layers.embedding.TPUEmbedding API का उपयोग करते समय, डेटासेट को Dataset.batch के साथ बैच करते समय drop_remainder=True विकल्प शामिल करना महत्वपूर्ण है, क्योंकि TPUEmbedding के लिए एक निश्चित बैच आकार की आवश्यकता होती है।
  • इसके अतिरिक्त, समान बैच आकार का उपयोग मूल्यांकन और प्रशिक्षण के लिए किया जाना चाहिए यदि वे उपकरणों के एक ही सेट पर हो रहे हैं।
  • अंत में, आपको विशेष इनपुट विकल्प के साथ tf.keras.utils.experimental.DatasetCreator का उपयोग करना चाहिए- experimental_fetch_to_device=False - tf.distribute.InputOptions (जिसमें रणनीति-विशिष्ट कॉन्फ़िगरेशन हैं)। यह नीचे दिखाया गया है:
global_batch_size = 8

def _input_dataset(context: tf.distribute.InputContext):
{"dense_feature": features,
"sparse_feature": tf.SparseTensor(
, [1, 2])},
= dataset.shuffle(10).repeat()
= dataset.batch(
return dataset.prefetch(2)

def _eval_dataset(context: tf.distribute.InputContext):
{"dense_feature": eval_features,
"sparse_feature": tf.SparseTensor(
, [1, 2])},
= dataset.repeat()
= dataset.batch(
return dataset.prefetch(2)

= tf.distribute.InputOptions(

= tf.keras.utils.experimental.DatasetCreator(
, input_options=input_options)

= tf.keras.utils.experimental.DatasetCreator(
, input_options=input_options)

अगला, डेटा तैयार होने के बाद, आप एक TPUStrategy , और इस रणनीति के दायरे के तहत एक मॉडल, मेट्रिक्स और एक ऑप्टिमाइज़र को परिभाषित करेंगे ( Strategy.scope )।

आपको steps_per_execution में Model.compile के लिए एक नंबर चुनना चाहिए क्योंकि यह प्रत्येक tf.function कॉल के दौरान चलने वाले बैचों की संख्या को निर्दिष्ट करता है, और प्रदर्शन के लिए महत्वपूर्ण है। यह तर्क TPUEstimator में प्रयुक्त iterations_per_loop के समान है।

TensorFlow 1 में tf.tpu.experimental.embedding_column (और tf.tpu.experimental.shared_embedding_column ) के माध्यम से निर्दिष्ट सुविधाओं और तालिका कॉन्फ़िगरेशन को सीधे TensorFlow 2 में कॉन्फ़िगरेशन ऑब्जेक्ट्स की एक जोड़ी के माध्यम से निर्दिष्ट किया जा सकता है:

(अधिक विवरण के लिए संबद्ध API दस्तावेज़ देखें।)

strategy = tf.distribute.TPUStrategy(cluster_resolver)
with strategy.scope():
= tf.keras.optimizers.Adagrad(learning_rate=0.05)
= tf.keras.Input(shape=(2,), dtype=tf.float32, batch_size=global_batch_size)
= tf.keras.Input(shape=(), dtype=tf.int32, batch_size=global_batch_size)
= tfrs.layers.embedding.TPUEmbedding(
=tf.initializers.TruncatedNormal(mean=0.0, stddev=1)),
= tf.keras.layers.Concatenate(axis=1)([dense_input, embedded_input])
= tf.keras.layers.Dense(1)(input)
= tf.keras.Model(inputs={"dense_feature": dense_input, "sparse_feature": sparse_input}, outputs=result)
.compile(optimizer, "mse", steps_per_execution=10)
इसके साथ, आप प्रशिक्षण डेटासेट के साथ मॉडल को प्रशिक्षित करने के लिए तैयार हैं:, epochs=5, steps_per_epoch=10)
अंत में, मूल्यांकन डेटासेट का उपयोग करके मॉडल का मूल्यांकन करें:

अगले कदम

API दस्तावेज़ों में TPU-विशिष्ट एम्बेडिंग सेट करने के बारे में अधिक जानें:

TensorFlow 2 में TPUStrategy के बारे में अधिक जानकारी के लिए, निम्नलिखित संसाधनों पर विचार करें:

अपने प्रशिक्षण को अनुकूलित करने के बारे में अधिक जानने के लिए, देखें:

टीपीयू—मशीन लर्निंग के लिए गूगल के विशेष एएसआईसी— गूगल कोलाब, टीपीयू रिसर्च क्लाउड और क्लाउड टीपीयू के जरिए उपलब्ध हैं।