forme3d

3dshapes è un set di dati di forme 3D generate proceduralmente da 6 fattori latenti indipendenti dalla verità di base. Questi fattori sono il colore del pavimento, il colore della parete, il colore dell'oggetto , la scala , la forma e l' orientamento .

Tutte le possibili combinazioni di questi latenti sono presenti esattamente una volta, generando N = 480000 immagini totali.

Valori dei fattori latenti

  • tonalità del pavimento: 10 valori spaziati linearmente in [0, 1]
  • tonalità della parete: 10 valori spaziati linearmente in [0, 1]
  • tonalità oggetto: 10 valori spaziati linearmente in [0, 1]
  • scala: 8 valori spaziati linearmente in [0, 1]
  • forma: 4 valori in [0, 1, 2, 3]
  • orientamento: 15 valori spaziati linearmente in [-30, 30]

Abbiamo variato un latente alla volta (a partire dall'orientamento, quindi dalla forma, ecc.) E abbiamo archiviato in sequenza le immagini in ordine fisso nell'array di images . I valori corrispondenti dei fattori vengono memorizzati nello stesso ordine nell'array delle labels .

Diviso Esempi
'train' 480.000
  • Struttura delle caratteristiche :
FeaturesDict({
    'image': Image(shape=(64, 64, 3), dtype=uint8),
    'label_floor_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'label_object_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=15),
    'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=8),
    'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=4),
    'label_wall_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
    'value_floor_hue': float32,
    'value_object_hue': float32,
    'value_orientation': float32,
    'value_scale': float32,
    'value_shape': float32,
    'value_wall_hue': float32,
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
Immagine Immagine (64, 64, 3) uint8
label_floor_hue ClassLabel int64
label_object_hue ClassLabel int64
etichetta_orientamento ClassLabel int64
scala_etichetta ClassLabel int64
etichetta_forma ClassLabel int64
label_wall_hue ClassLabel int64
value_floor_hue Tensore galleggiante32
valore_oggetto_tinta Tensore galleggiante32
valore_orientamento Tensore galleggiante32
valore_scala Tensore galleggiante32
valore_forma Tensore galleggiante32
valore_wall_hue Tensore galleggiante32

Visualizzazione

  • Citazione :
@misc{3dshapes18,
  title={3D Shapes Dataset},
  author={Burgess, Chris and Kim, Hyunjik},
  howpublished={https://github.com/deepmind/3dshapes-dataset/},
  year={2018}
}