Visualizzazione : Esplora in Conosci i tuoi dati
Descrizione :
3dshapes è un set di dati di forme 3D generate proceduralmente da 6 fattori latenti indipendenti dalla verità di base. Questi fattori sono il colore del pavimento, il colore della parete, il colore dell'oggetto , la scala , la forma e l' orientamento .
Tutte le possibili combinazioni di questi latenti sono presenti esattamente una volta, generando N = 480000 immagini totali.
Valori dei fattori latenti
- tonalità del pavimento: 10 valori spaziati linearmente in [0, 1]
- tonalità della parete: 10 valori spaziati linearmente in [0, 1]
- tonalità oggetto: 10 valori spaziati linearmente in [0, 1]
- scala: 8 valori spaziati linearmente in [0, 1]
- forma: 4 valori in [0, 1, 2, 3]
- orientamento: 15 valori spaziati linearmente in [-30, 30]
Abbiamo variato un latente alla volta (a partire dall'orientamento, quindi dalla forma, ecc.) E abbiamo archiviato in sequenza le immagini in ordine fisso nell'array di images
. I valori corrispondenti dei fattori vengono memorizzati nello stesso ordine nell'array delle labels
.
Documentazione aggiuntiva : Esplora documenti con codice
Pagina iniziale : https://github.com/deepmind/3d-shapes
Codice sorgente :
tfds.datasets.shapes3d.Builder
Versioni :
-
2.0.0
(impostazione predefinita): nuova API divisa ( https://tensorflow.org/datasets/splits )
-
Dimensione del download :
255.18 MiB
Dimensione del set di dati:
1.68 GiB
Cache automatica ( documentazione ): No
Divisioni :
Diviso | Esempi |
---|---|
'train' | 480.000 |
- Struttura delle caratteristiche :
FeaturesDict({
'image': Image(shape=(64, 64, 3), dtype=uint8),
'label_floor_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
'label_object_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=15),
'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=8),
'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=4),
'label_wall_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
'value_floor_hue': float32,
'value_object_hue': float32,
'value_orientation': float32,
'value_scale': float32,
'value_shape': float32,
'value_wall_hue': float32,
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
Immagine | Immagine | (64, 64, 3) | uint8 | |
label_floor_hue | ClassLabel | int64 | ||
label_object_hue | ClassLabel | int64 | ||
etichetta_orientamento | ClassLabel | int64 | ||
scala_etichetta | ClassLabel | int64 | ||
etichetta_forma | ClassLabel | int64 | ||
label_wall_hue | ClassLabel | int64 | ||
value_floor_hue | Tensore | galleggiante32 | ||
valore_oggetto_tinta | Tensore | galleggiante32 | ||
valore_orientamento | Tensore | galleggiante32 | ||
valore_scala | Tensore | galleggiante32 | ||
valore_forma | Tensore | galleggiante32 | ||
valore_wall_hue | Tensore | galleggiante32 |
Chiavi supervisionate (Vedi
as_supervised
doc ):None
Figura ( tfds.show_examples ):
- Esempi ( tfds.as_dataframe ):
- Citazione :
@misc{3dshapes18,
title={3D Shapes Dataset},
author={Burgess, Chris and Kim, Hyunjik},
howpublished={https://github.com/deepmind/3dshapes-dataset/},
year={2018}
}