TensorFlow Datasets: すぐに使用できるデータセットのコレクションです。

TensorFlow Datasets は、TensorFlow や他の Python ML フレームワーク(JAX など)で使用できるデータセットのコレクションです。 データセットはすべて tf.data.Datasets として公開され、使いやすく高性能な入力パイプラインを実現できます。 開始にあたっては、ガイドデータセットのリストをご覧ください。
import tensorflow.compat.v2 as tf
import tensorflow_datasets as tfds

# Construct a tf.data.Dataset
ds = tfds.load('mnist', split='train', shuffle_files=True)

# Build your input pipeline
ds = ds.shuffle(1024).batch(32).prefetch(tf.data.experimental.AUTOTUNE)
for example in ds.take(1):
  image, label = example["image"], example["label"]