Di chuyển từ TPU embedding_columns sang TPUEmbedding layer

Hướng dẫn này trình bày cách di chuyển đào tạo nhúng trên TPU từ API embedding_column của TensorFlow 1 với TPUEstimator sang API lớp TPUEmbedding của TensorFlow 2 với TPUStrategy .

Nhúng là ma trận (lớn). Chúng là các bảng tra cứu ánh xạ từ không gian đối tượng thưa thớt đến các vectơ dày đặc. Nhúng cung cấp các biểu diễn hiệu quả và dày đặc, nắm bắt các điểm tương đồng và mối quan hệ phức tạp giữa các đối tượng địa lý.

TensorFlow bao gồm hỗ trợ chuyên biệt để đào tạo nhúng trên TPU. Hỗ trợ nhúng dành riêng cho TPU này cho phép bạn đào tạo các nhúng lớn hơn bộ nhớ của một thiết bị TPU đơn lẻ và sử dụng các đầu vào thưa thớt và rách nát trên TPU.

Để biết thêm thông tin, hãy tham khảo tài liệu API của lớp tfrs.layers.embedding.TPUEmbedding , cũng như tài liệu tf.tpu.experimental.embedding.TableConfigtf.tpu.experimental.embedding.FeatureConfig để biết thêm thông tin. Để biết tổng quan về tf.distribute.TPUStrategy , hãy xem hướng dẫn đào tạo Phân tán và hướng dẫn Sử dụng TPUs . Nếu bạn đang di chuyển từ TPUEstimator sang TPUStrategy , hãy xem hướng dẫn di chuyển TPU .

Thành lập

Bắt đầu bằng cách cài đặt TensorFlow Recommenders và nhập một số gói cần thiết:

pip install tensorflow-recommenders
import tensorflow as tf
import tensorflow.compat.v1 as tf1

# TPUEmbedding layer is not part of TensorFlow.
import tensorflow_recommenders as tfrs
/tmpfs/src/tf_docs_env/lib/python3.6/site-packages/requests/__init__.py:104: RequestsDependencyWarning: urllib3 (1.26.8) or chardet (2.3.0)/charset_normalizer (2.0.11) doesn't match a supported version!

Và chuẩn bị một tập dữ liệu đơn giản cho mục đích trình diễn:

features = [[1., 1.5]]
= [[0, 0], [0, 1]]
= [0, 5]
= [[0.3]]
= [[4., 4.5]]
= [[0, 0], [0, 1]]
= [4, 3]
= [[0.8]]

TensorFlow 1: Đào tạo nhúng trên TPU với TPUEstimator

Trong TensorFlow 1, bạn thiết lập nhúng TPU bằng cách sử dụng API tf.compat.v1.tpu.experimental.embedding_column và đào tạo / đánh giá mô hình trên TPU với tf.compat.v1.estimator.tpu.TPUEstimator .

Đầu vào là các số nguyên khác nhau, từ 0 đến kích thước từ vựng cho bảng nhúng TPU. Bắt đầu bằng việc mã hóa các đầu vào thành ID phân loại với tf.feature_column.categorical_column_with_identity . Sử dụng "sparse_feature" cho tham số key , vì các tính năng đầu vào có giá trị số nguyên, trong khi num_buckets là kích thước từ vựng cho bảng nhúng ( 10 ).

embedding_id_column = (
="sparse_feature", num_buckets=10))

Tiếp theo, chuyển đổi các đầu vào phân loại thưa thớt thành một biểu diễn dày đặc với tpu.experimental.embedding_column , trong đó dimension là chiều rộng của bảng nhúng. Nó sẽ lưu trữ một vectơ nhúng cho mỗi num_buckets .

embedding_column = tf1.tpu.experimental.embedding_column(
, dimension=5)

Bây giờ, hãy xác định cấu hình nhúng dành riêng cho TPU qua tf.estimator.tpu.experimental.EmbeddingConfigSpec . Sau đó, bạn sẽ chuyển nó tới tf.estimator.tpu.TPUEstimator dưới dạng tham số embedding_config_spec .

embedding_config_spec = tf1.estimator.tpu.experimental.EmbeddingConfigSpec(

Tiếp theo, để sử dụng TPUEstimator , hãy xác định:

  • Một chức năng đầu vào cho dữ liệu đào tạo
  • Một chức năng đầu vào đánh giá cho dữ liệu đánh giá
  • Một chức năng mô hình để hướng dẫn TPUEstimator cách xác định op đào tạo với các tính năng và nhãn
def _input_fn(params):
= tf1.data.Dataset.from_tensor_slices((
{"dense_feature": features,
"sparse_feature": tf1.SparseTensor(
, [1, 2])},
= dataset.repeat()
return dataset.batch(params['batch_size'], drop_remainder=True)

def _eval_input_fn(params):
= tf1.data.Dataset.from_tensor_slices((
{"dense_feature": eval_features,
"sparse_feature": tf1.SparseTensor(
, [1, 2])},
= dataset.repeat()
return dataset.batch(params['batch_size'], drop_remainder=True)

def _model_fn(features, labels, mode, params):
= tf1.keras.layers.DenseFeatures(embedding_column)(features)
= tf1.keras.layers.Concatenate(axis=1)(
[embedding_features, features["dense_feature"]])
= tf1.layers.Dense(1)(concatenated_features)
= tf1.losses.mean_squared_error(labels=labels, predictions=logits)
= tf1.train.AdagradOptimizer(0.05)
= tf1.tpu.CrossShardOptimizer(optimizer)
= optimizer.minimize(loss, global_step=tf1.train.get_global_step())
return tf1.estimator.tpu.TPUEstimatorSpec(mode, loss=loss, train_op=train_op)

Với những chức năng đó được xác định, hãy tạo một tf.distribute.cluster_resolver.TPUClusterResolver cung cấp thông tin cụm và đối tượng tf.compat.v1.estimator.tpu.RunConfig .

Cùng với chức năng mô hình bạn đã xác định, bây giờ bạn có thể tạo một TPUEstimator . Tại đây, bạn sẽ đơn giản hóa quy trình bằng cách bỏ qua việc tiết kiệm trạm kiểm soát. Sau đó, bạn sẽ chỉ định kích thước lô cho cả đào tạo và đánh giá cho TPUEstimator .

cluster_resolver = tf1.distribute.cluster_resolver.TPUClusterResolver(tpu='')
print("All devices: ", tf1.config.list_logical_devices('TPU'))
All devices:  []
tpu_config = tf1.estimator.tpu.TPUConfig(
= tf1.estimator.tpu.RunConfig(
= tf1.estimator.tpu.TPUEstimator(
=_model_fn, config=config, train_batch_size=8, eval_batch_size=8,
WARNING:tensorflow:Estimator's model_fn (<function _model_fn at 0x7eff1dbf4ae8>) includes params argument, but params are not passed to Estimator.
Gọi TPUEstimator.train để bắt đầu đào tạo mô hình:

estimator.train(_input_fn, steps=1)
<tensorflow_estimator.python.estimator.tpu.tpu_estimator.TPUEstimator at 0x7eff1dbfa7b8>

Sau đó, gọi TPUEstimator.evaluate để đánh giá mô hình bằng cách sử dụng dữ liệu đánh giá:

estimator.evaluate(_eval_input_fn, steps=1)
{'loss': 36.28813, 'global_step': 1}

TensorFlow 2: Đào tạo nhúng trên TPU với TPUStrategy

Trong TensorFlow 2, để đào tạo công nhân TPU, hãy sử dụng tf.distribute.TPUStrategy cùng với API Keras để định nghĩa và đào tạo / đánh giá mô hình. (Tham khảo hướng dẫn Sử dụng TPUs để biết thêm các ví dụ về đào tạo với Keras Model.fit và vòng đào tạo tùy chỉnh (với tf. tf.GradientTape tf.function .)

Vì bạn cần thực hiện một số công việc khởi tạo để kết nối với cụm từ xa và khởi tạo TPU worker, hãy bắt đầu bằng cách tạo TPUClusterResolver để cung cấp thông tin cụm và kết nối với cụm. (Tìm hiểu thêm trong phần khởi tạo TPU của hướng dẫn Sử dụng TPU .)

cluster_resolver = tf.distribute.cluster_resolver.TPUClusterResolver(tpu='')
print("All devices: ", tf.config.list_logical_devices('TPU'))
All devices:  [LogicalDevice(name='/job:worker/replica:0/task:0/device:TPU:0', device_type='TPU'), LogicalDevice(name='/job:worker/replica:0/task:0/device:TPU:1', device_type='TPU'), LogicalDevice(name='/job:worker/replica:0/task:0/device:TPU:2', device_type='TPU'), LogicalDevice(name='/job:worker/replica:0/task:0/device:TPU:3', device_type='TPU'), LogicalDevice(name='/job:worker/replica:0/task:0/device:TPU:4', device_type='TPU'), LogicalDevice(name='/job:worker/replica:0/task:0/device:TPU:5', device_type='TPU'), LogicalDevice(name='/job:worker/replica:0/task:0/device:TPU:6', device_type='TPU'), LogicalDevice(name='/job:worker/replica:0/task:0/device:TPU:7', device_type='TPU')]

Cùng với đó, bạn đã sẵn sàng đào tạo mô hình với tập dữ liệu đào tạo:

model.fit(input_dataset, epochs=5, steps_per_epoch=10)
Cuối cùng, đánh giá mô hình bằng cách sử dụng tập dữ liệu đánh giá:

model.evaluate(eval_dataset, steps=1, return_dict=True)
Bước tiếp theo

Tìm hiểu thêm về cách thiết lập nhúng TPU cụ thể trong tài liệu API:

Để biết thêm thông tin về TPUStrategy trong TensorFlow 2, hãy xem xét các tài nguyên sau:

Để tìm hiểu thêm về cách tùy chỉnh đào tạo của bạn, hãy tham khảo:

TPU — ASIC chuyên biệt của Google dành cho máy học — có sẵn thông qua Google Colab , TPU Research CloudCloud TPU .