- 설명 :
dSprites는 6개의 실제 독립 잠재 요인으로부터 절차적으로 생성된 2D 모양의 데이터 세트입니다. 이러한 요소는 스프라이트의 색상 , 모양 , 크기 , 회전 , x 및 y 위치입니다.
이러한 잠재 요소의 가능한 모든 조합은 정확히 한 번만 존재하며 N = 737280개의 총 이미지를 생성합니다.
잠재 요인 값
- 색상: 흰색
- 모양: 정사각형, 타원, 심장
- 척도: [0.5, 1] 단위로 선형 간격으로 배치된 6개 값
- 방향: [0, 2pi] 값 40개
- 위치 X: [0, 1]의 값 32개
- 위치 Y: [0, 1]의 값 32개
우리는 한 번에 하나의 잠재성을 변경하고(Y 위치에서 시작하여 X 위치 등) 고정된 순서로 이미지를 순차적으로 저장했습니다. 따라서 첫 번째 차원의 순서는 고정되어 있으며 해당 이미지에 해당하는 잠재 값으로 다시 매핑할 수 있습니다.
우리는 모든 픽셀 출력이 서로 다른지 확인하면서 단계 변화를 최소화하기 위해 의도적으로 잠재 값을 선택했습니다. 소음은 추가되지 않았습니다.
추가 문서 : 코드 가 포함된 논문 탐색
소스 코드 :
tfds.datasets.dsprites.Builder
버전 :
-
2.0.0
(기본값): 새로운 분할 API( https://tensorflow.org/datasets/splits ) -
2.1.0
: 릴리스 노트가 없습니다.
-
다운로드 크기 :
26.73 MiB
데이터 세트 크기 :
Unknown size
자동 캐시 ( 문서 ): 알 수 없음
분할 :
나뉘다 | 예 |
---|---|
'train' | 737,280 |
- 기능 구조 :
FeaturesDict({
'image': Image(shape=(64, 64, 1), dtype=uint8),
'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=40),
'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=6),
'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=3),
'label_x_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
'label_y_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
'value_orientation': float32,
'value_scale': float32,
'value_shape': float32,
'value_x_position': float32,
'value_y_position': float32,
})
- 기능 문서 :
특징 | 수업 | 모양 | Dtype | 설명 |
---|---|---|---|---|
특징Dict | ||||
영상 | 영상 | (64, 64, 1) | uint8 | |
label_orientation | 클래스 라벨 | 정수64 | ||
label_scale | 클래스 라벨 | 정수64 | ||
label_shape | 클래스 라벨 | 정수64 | ||
label_x_position | 클래스 라벨 | 정수64 | ||
label_y_position | 클래스 라벨 | 정수64 | ||
가치지향 | 텐서 | float32 | ||
가치 규모 | 텐서 | float32 | ||
value_shape | 텐서 | float32 | ||
value_x_position | 텐서 | float32 | ||
value_y_position | 텐서 | float32 |
감독되는 키 (
as_supervised
doc 참조):None
그림 ( tfds.show_examples ):
- 예 ( tfds.as_dataframe ):
- 인용 :
@misc{dsprites17,
author = {Loic Matthey and Irina Higgins and Demis Hassabis and Alexander Lerchner},
title = {dSprites: Disentanglement testing Sprites dataset},
howpublished= {https://github.com/deepmind/dsprites-dataset/},
year = "2017",
}