TensorFlow Datasets: một tập hợp các tập dữ liệu sẵn sàng sử dụng.
Tập dữ liệu TensorFlow là một tập hợp các tập dữ liệu sẵn sàng để sử dụng, với TensorFlow hoặc các khuôn khổ Python ML khác, chẳng hạn như Jax. Tất cả các tập dữ liệu được tiếp xúc như
tf.data.Datasets
, cho phép dễ dàng sử dụng và đường ống đầu vào hiệu suất cao. Để bắt đầu xem các hướng dẫn và chúng tôi danh sách các bộ dữ liệu .
import tensorflow as tf import tensorflow_datasets as tfds # Construct a tf.data.Dataset ds = tfds.load('mnist', split='train', shuffle_files=True) # Build your input pipeline ds = ds.shuffle(1024).batch(32).prefetch(tf.data.AUTOTUNE) for example in ds.take(1): image, label = example["image"], example["label"]