ディススプライト

説明：

dSprites は、6 つのグラウンドトゥルースの独立した潜在要素から手続き的に生成された 2D 形状のデータセットです。これらの要素は、スプライトの色、形状、スケール、回転、 xおよびy位置です。

これらの潜在的な組み合わせはすべて 1 回だけ存在し、合計 N = 737280 の画像が生成されます。

潜在因子の値

色: ホワイト
形状: 正方形、楕円形、ハート
スケール: [0.5, 1] で直線的に配置された 6 つの値
方向: [0, 2 pi] の 40 個の値
位置 X: [0, 1] の 32 個の値
位置 Y: [0, 1] の 32 個の値

一度に 1 つの潜在画像を変更し (位置 Y から開始し、次に位置 X など)、固定された順序で画像を順次保存しました。したがって、最初の次元に沿った順序は固定されており、その画像に対応する潜在値の値にマッピングし直すことができます。

すべてのピクセル出力が異なることを保証しながら、ステップ変化を最小限にするために、潜在値を意図的に選択しました。ノイズは追加されていません。

追加ドキュメント:コード付きの論文について調べる
ホームページ: https://github.com/deepmind/dsprites-dataset
ソースコード: tfds.datasets.dsprites.Builder
バージョン:
- 2.0.0 (デフォルト): 新しい分割 API ( https://tensorflow.org/datasets/splits )
- 2.1.0 : リリースノートはありません。
ダウンロードサイズ: 26.73 MiB
データセットのサイズ: Unknown size
自動キャッシュ(ドキュメント): 不明
分割:

スプリット	例
`'train'`	737,280

機能の構造:

FeaturesDict({
    'image': Image(shape=(64, 64, 1), dtype=uint8),
    'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=40),
    'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=6),
    'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'label_x_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
    'label_y_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
    'value_orientation': float32,
    'value_scale': float32,
    'value_shape': float32,
    'value_x_position': float32,
    'value_y_position': float32,
})

機能ドキュメント:

特徴	クラス	形	Dタイプ
	特徴辞書
画像	画像	(64、64、1)	uint8
ラベルの向き	クラスラベル		int64
ラベルスケール	クラスラベル		int64
ラベルの形状	クラスラベル		int64
ラベル_x_位置	クラスラベル		int64
ラベルy_位置	クラスラベル		int64
値の方向	テンソル		float32
値のスケール	テンソル		float32
値の形状	テンソル		float32
値_x_位置	テンソル		float32
値y_位置	テンソル		float32

監視キー( as_supervised docを参照): None
図( tfds.show_examples ):

視覚化

例( tfds.as_dataframe ):

引用：

@misc{dsprites17,
author = {Loic Matthey and Irina Higgins and Demis Hassabis and Alexander Lerchner},
title = {dSprites: Disentanglement testing Sprites dataset},
howpublished= {https://github.com/deepmind/dsprites-dataset/},
year = "2017",
}

ディススプライト コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

潜在因子の値

ディススプライト