Görselleştirme : Verilerinizi keşfedin
Açıklama :
Açık Görüntüler, görüntü düzeyinde etiketler ve nesne sınırlayıcı kutularla açıklama eklenmiş ~9M görüntüden oluşan bir veri kümesidir.
V4'ün eğitim seti, 1,74 milyon görüntüde 600 nesne sınıfı için 14,6 milyon sınırlayıcı kutu içerir, bu da onu nesne konumu ek açıklamalarıyla mevcut en büyük veri kümesi yapar. Kutular, doğruluk ve tutarlılığı sağlamak için büyük ölçüde profesyonel açıklayıcılar tarafından manuel olarak çizilmiştir. Görüntüler çok çeşitlidir ve genellikle birkaç nesne içeren karmaşık sahneler içerir (ortalama olarak görüntü başına 8,4). Ayrıca veri kümesi, binlerce sınıfa yayılan görüntü düzeyinde etiketlerle açıklanır.
Ana Sayfa : https://storage.googleapis.com/openimages/web/index.html
Kaynak kodu :
tfds.datasets.open_images_v4.Builder
sürümler :
-
2.0.0
(varsayılan): Yeni bölünmüş API ( https://tensorflow.org/datasets/splits )
-
İndirme boyutu :
565.11 GiB
Otomatik önbelleğe alınmış ( belgeleme ): Hayır
bölmeler :
Bölmek | örnekler |
---|---|
'test' | 125.436 |
'train' | 1.743.042 |
'validation' | 41.620 |
- Özellik yapısı :
FeaturesDict({
'bobjects': Sequence({
'bbox': BBoxFeature(shape=(4,), dtype=float32),
'is_depiction': int8,
'is_group_of': int8,
'is_inside': int8,
'is_occluded': int8,
'is_truncated': int8,
'label': ClassLabel(shape=(), dtype=int64, num_classes=601),
'source': ClassLabel(shape=(), dtype=int64, num_classes=6),
}),
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/filename': Text(shape=(), dtype=string),
'objects': Sequence({
'confidence': int32,
'label': ClassLabel(shape=(), dtype=int64, num_classes=19995),
'source': ClassLabel(shape=(), dtype=int64, num_classes=6),
}),
'objects_trainable': Sequence({
'confidence': int32,
'label': ClassLabel(shape=(), dtype=int64, num_classes=7186),
'source': ClassLabel(shape=(), dtype=int64, num_classes=6),
}),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
Bobjects | Sekans | |||
bobjects/bbox | BBoxÖzelliği | (4,) | şamandıra32 | |
bobjects/is_depiction | tensör | int8 | ||
bobjects/is_group_of | tensör | int8 | ||
bobjects/is_inside | tensör | int8 | ||
bobjects/is_occluded | tensör | int8 | ||
bobjects/is_truncated | tensör | int8 | ||
nesneler/etiket | SınıfEtiketi | int64 | ||
nesne/kaynak | SınıfEtiketi | int64 | ||
görüntü | resim | (Yok, Yok, 3) | uint8 | |
resim/dosya adı | Metin | sicim | ||
nesneler | Sekans | |||
nesneler/güven | tensör | int32 | ||
nesneler/etiket | SınıfEtiketi | int64 | ||
nesneler/kaynak | SınıfEtiketi | int64 | ||
nesneler_eğitilebilir | Sekans | |||
nesneler_eğitilebilir/güven | tensör | int32 | ||
nesneler_eğitilebilir/etiket | SınıfEtiketi | int64 | ||
nesneler_eğitilebilir/kaynak | SınıfEtiketi | int64 |
Denetlenen anahtarlar (Bkz
as_supervised
doc ):None
Alıntı :
@article{OpenImages,
author = {Alina Kuznetsova and
Hassan Rom and
Neil Alldrin and
Jasper Uijlings and
Ivan Krasin and
Jordi Pont-Tuset and
Shahab Kamali and
Stefan Popov and
Matteo Malloci and
Tom Duerig and
Vittorio Ferrari},
title = {The Open Images Dataset V4: Unified image classification,
object detection, and visual relationship detection at scale},
year = {2018},
journal = {arXiv:1811.00982}
}
@article{OpenImages2,
author = {Krasin, Ivan and
Duerig, Tom and
Alldrin, Neil and
Ferrari, Vittorio
and Abu-El-Haija, Sami and
Kuznetsova, Alina and
Rom, Hassan and
Uijlings, Jasper and
Popov, Stefan and
Kamali, Shahab and
Malloci, Matteo and
Pont-Tuset, Jordi and
Veit, Andreas and
Belongie, Serge and
Gomes, Victor and
Gupta, Abhinav and
Sun, Chen and
Chechik, Gal and
Cai, David and
Feng, Zheyun and
Narayanan, Dhyanesh and
Murphy, Kevin},
title = {OpenImages: A public dataset for large-scale multi-label and
multi-class image classification.},
journal = {Dataset available from
https://storage.googleapis.com/openimages/web/index.html},
year={2017}
}
open_images_v4/original (varsayılan yapılandırma)
Yapılandırma açıklaması : Orijinal çözünürlük ve kalitedeki görüntüler.
Veri kümesi boyutu :
562.42 GiB
Şekil ( tfds.show_examples ):
- Örnekler ( tfds.as_dataframe ):
open_images_v4/300k
Yapılandırma açıklaması : Görüntüler, 72 JPEG kalitesinde yaklaşık 300.000 piksele sahiptir.
Veri kümesi boyutu :
81.92 GiB
Şekil ( tfds.show_examples ):
- Örnekler ( tfds.as_dataframe ):
open_images_v4/200k
Yapılandırma açıklaması : Görüntüler, 72 JPEG kalitesinde yaklaşık 200.000 piksele sahiptir.
Veri kümesi boyutu :
60.70 GiB
Şekil ( tfds.show_examples ):
- Örnekler ( tfds.as_dataframe ):