- Opis :
3dshapes to zbiór danych kształtów 3D wygenerowanych proceduralnie na podstawie 6 niezależnych od prawdy czynników ukrytych. Czynnikami tymi są kolor podłogi , kolor ścian , kolor obiektu , skala , kształt i orientacja .
Wszystkie możliwe kombinacje tych latencji występują dokładnie raz, tworząc łącznie N = 480000 obrazów.
Ukryte wartości czynników
- odcień podłogi: 10 wartości rozmieszczonych liniowo w [0, 1]
- odcień ściany: 10 wartości rozmieszczonych liniowo w [0, 1]
- odcień obiektu: 10 wartości rozmieszczonych liniowo w [0, 1]
- skala: 8 wartości rozmieszczonych liniowo w [0, 1]
- kształt: 4 wartości w [0, 1, 2, 3]
- orientacja: 15 wartości rozmieszczonych liniowo w [-30, 30]
Zmienialiśmy po jednym ukryciu na raz (zaczynając od orientacji, następnie kształtu itp.) i sekwencyjnie przechowywaliśmy obrazy w ustalonej kolejności w tablicy images
. Odpowiednie wartości współczynników są przechowywane w tej samej kolejności w tablicy labels
.
Dodatkowa dokumentacja : Eksploruj w dokumentach z kodem
Strona główna : https://github.com/deepmind/3d-shapes
Kod źródłowy :
tfds.datasets.shapes3d.Builder
Wersje :
-
2.0.0
(domyślnie): Nowe podzielone API ( https://tensorflow.org/datasets/splits )
-
Rozmiar pobierania :
255.18 MiB
Rozmiar zbioru danych :
1.68 GiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Podział | Przykłady |
---|---|
'train' | 480 000 |
- Struktura funkcji :
FeaturesDict({
'image': Image(shape=(64, 64, 3), dtype=uint8),
'label_floor_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
'label_object_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=15),
'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=8),
'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=4),
'label_wall_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
'value_floor_hue': float32,
'value_object_hue': float32,
'value_orientation': float32,
'value_scale': float32,
'value_shape': float32,
'value_wall_hue': float32,
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDykt | ||||
obraz | Obraz | (64, 64, 3) | uint8 | |
label_floor_hue | Etykieta klasy | int64 | ||
etykieta_obiekt_odcień | Etykieta klasy | int64 | ||
orientacja_etykiety | Etykieta klasy | int64 | ||
etykieta_skala | Etykieta klasy | int64 | ||
etykieta_kształt | Etykieta klasy | int64 | ||
label_wall_hue | Etykieta klasy | int64 | ||
wartość_odcienia_podłogi | Napinacz | pływak32 | ||
wartość_obiektu_barwa | Napinacz | pływak32 | ||
orientacja_wartości | Napinacz | pływak32 | ||
skala wartości | Napinacz | pływak32 | ||
wartość_kształt | Napinacz | pływak32 | ||
wartość_odcienia_ściany | Napinacz | pływak32 |
Klucze nadzorowane (zobacz dokument
as_supervised
):None
Rysunek ( tfds.show_examples ):
- Przykłady ( tfds.as_dataframe ):
- Cytat :
@misc{3dshapes18,
title={3D Shapes Dataset},
author={Burgess, Chris and Kim, Hyunjik},
howpublished={https://github.com/deepmind/3dshapes-dataset/},
year={2018}
}