- Tanım :
3dshapes, temel gerçeklikten bağımsız 6 gizli faktörden prosedürel olarak oluşturulan 3 boyutlu şekillerden oluşan bir veri kümesidir. Bu faktörler zemin rengi , duvar rengi , nesne rengi , ölçek , şekil ve yönelimdir .
Bu gizli öğelerin olası tüm kombinasyonları tam olarak bir kez mevcut olup N = 480000 toplam görüntü oluşturulur.
Gizli faktör değerleri
- zemin tonu: [0, 1] şeklinde doğrusal olarak aralıklı 10 değer
- duvar tonu: [0, 1] şeklinde doğrusal aralıklarla yerleştirilmiş 10 değer
- nesne tonu: [0, 1]'de doğrusal olarak aralıklı 10 değer
- ölçek: [0, 1] şeklinde doğrusal olarak aralıklı 8 değer
- şekil: [0, 1, 2, 3]'te 4 değer
- yönlendirme: [-30, 30] aralığında doğrusal olarak aralıklı 15 değer
Her seferinde gizli olanı değiştirdik (yönelimden başlayarak, sonra şekilden vb.) ve görüntüleri, images
dizisinde sabit bir sırayla sırayla depoladık. Faktörlerin karşılık gelen değerleri, labels
dizisinde aynı sırada saklanır.
Ana sayfa : https://github.com/deepmind/3d-shapes
Kaynak kodu :
tfds.datasets.shapes3d.Builder
Sürümler :
-
2.0.0
(varsayılan): Yeni bölünmüş API ( https://tensorflow.org/datasets/splits )
-
İndirme boyutu :
255.18 MiB
Veri kümesi boyutu :
1.68 GiB
Otomatik önbelleğe alınmış ( belgeler ): Hayır
Bölünmeler :
Bölmek | Örnekler |
---|---|
'train' | 480.000 |
- Özellik yapısı :
FeaturesDict({
'image': Image(shape=(64, 64, 3), dtype=uint8),
'label_floor_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
'label_object_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=15),
'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=8),
'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=4),
'label_wall_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
'value_floor_hue': float32,
'value_object_hue': float32,
'value_orientation': float32,
'value_scale': float32,
'value_shape': float32,
'value_wall_hue': float32,
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
resim | Resim | (64, 64, 3) | uint8 | |
label_floor_hue | SınıfEtiketi | int64 | ||
label_object_hue | SınıfEtiketi | int64 | ||
label_orientation | SınıfEtiketi | int64 | ||
label_scale | SınıfEtiketi | int64 | ||
etiket_şekli | SınıfEtiketi | int64 | ||
label_wall_hue | SınıfEtiketi | int64 | ||
value_floor_hue | Tensör | kayan nokta32 | ||
value_object_hue | Tensör | kayan nokta32 | ||
Değer oryantasyonu | Tensör | kayan nokta32 | ||
değer_ölçeği | Tensör | kayan nokta32 | ||
değer_şekli | Tensör | kayan nokta32 | ||
value_wall_hue | Tensör | kayan nokta32 |
Denetlenen anahtarlar (
as_supervised
belgesine bakın):None
Şekil ( tfds.show_examples ):
- Örnekler ( tfds.as_dataframe ):
- Alıntı :
@misc{3dshapes18,
title={3D Shapes Dataset},
author={Burgess, Chris and Kim, Hyunjik},
howpublished={https://github.com/deepmind/3dshapes-dataset/},
year={2018}
}