- Keterangan :
Open Images adalah kumpulan data ~9 juta gambar yang telah dianotasi dengan label tingkat gambar dan kotak pembatas objek.
Set pelatihan V4 berisi 14,6 juta kotak pembatas untuk 600 kelas objek pada 1,74 juta gambar, menjadikannya kumpulan data terbesar yang ada dengan anotasi lokasi objek. Kotak-kotak tersebut sebagian besar digambar secara manual oleh anotator profesional untuk memastikan keakuratan dan konsistensi. Gambarnya sangat beragam dan sering kali berisi pemandangan kompleks dengan beberapa objek (rata-rata 8,4 per gambar). Selain itu, kumpulan data dianotasi dengan label tingkat gambar yang mencakup ribuan kelas.
Dokumentasi Tambahan : Jelajahi Makalah Dengan Kode
Beranda : https://storage.googleapis.com/openimages/web/index.html
Kode sumber :
tfds.datasets.open_images_v4.Builder
Versi :
-
2.0.0
(default): API terpisah baru ( https://tensorflow.org/datasets/splits )
-
Ukuran unduhan :
565.11 GiB
Cache otomatis ( dokumentasi ): Tidak
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 125.436 |
'train' | 1.743.042 |
'validation' | 41.620 |
- Struktur fitur :
FeaturesDict({
'bobjects': Sequence({
'bbox': BBoxFeature(shape=(4,), dtype=float32),
'is_depiction': int8,
'is_group_of': int8,
'is_inside': int8,
'is_occluded': int8,
'is_truncated': int8,
'label': ClassLabel(shape=(), dtype=int64, num_classes=601),
'source': ClassLabel(shape=(), dtype=int64, num_classes=6),
}),
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/filename': Text(shape=(), dtype=string),
'objects': Sequence({
'confidence': int32,
'label': ClassLabel(shape=(), dtype=int64, num_classes=19995),
'source': ClassLabel(shape=(), dtype=int64, num_classes=6),
}),
'objects_trainable': Sequence({
'confidence': int32,
'label': ClassLabel(shape=(), dtype=int64, num_classes=7186),
'source': ClassLabel(shape=(), dtype=int64, num_classes=6),
}),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Tipe D | Keterangan |
---|---|---|---|---|
FiturDict | ||||
objek bob | Urutan | |||
bobjects/bbox | Fitur BBox | (4,) | float32 | |
bobjects/is_depiction | Tensor | int8 | ||
bobjects/is_group_of | Tensor | int8 | ||
bobjects/is_inside | Tensor | int8 | ||
bobjects/is_occluded | Tensor | int8 | ||
bobjects/is_truncated | Tensor | int8 | ||
objek/label | Label Kelas | int64 | ||
objek/sumber | Label Kelas | int64 | ||
gambar | Gambar | (Tidak ada, Tidak ada, 3) | uint8 | |
gambar/nama file | Teks | rangkaian | ||
objek | Urutan | |||
objek/keyakinan | Tensor | int32 | ||
benda/label | Label Kelas | int64 | ||
benda/sumber | Label Kelas | int64 | ||
objek_dapat dilatih | Urutan | |||
objek_dapat dilatih/percaya diri | Tensor | int32 | ||
objek_dapat dilatih/label | Label Kelas | int64 | ||
objek_dapat dilatih/sumber | Label Kelas | int64 |
Kunci yang diawasi (Lihat dokumen
as_supervised
):None
Kutipan :
@article{OpenImages,
author = {Alina Kuznetsova and
Hassan Rom and
Neil Alldrin and
Jasper Uijlings and
Ivan Krasin and
Jordi Pont-Tuset and
Shahab Kamali and
Stefan Popov and
Matteo Malloci and
Tom Duerig and
Vittorio Ferrari},
title = {The Open Images Dataset V4: Unified image classification,
object detection, and visual relationship detection at scale},
year = {2018},
journal = {arXiv:1811.00982}
}
@article{OpenImages2,
author = {Krasin, Ivan and
Duerig, Tom and
Alldrin, Neil and
Ferrari, Vittorio
and Abu-El-Haija, Sami and
Kuznetsova, Alina and
Rom, Hassan and
Uijlings, Jasper and
Popov, Stefan and
Kamali, Shahab and
Malloci, Matteo and
Pont-Tuset, Jordi and
Veit, Andreas and
Belongie, Serge and
Gomes, Victor and
Gupta, Abhinav and
Sun, Chen and
Chechik, Gal and
Cai, David and
Feng, Zheyun and
Narayanan, Dhyanesh and
Murphy, Kevin},
title = {OpenImages: A public dataset for large-scale multi-label and
multi-class image classification.},
journal = {Dataset available from
https://storage.googleapis.com/openimages/web/index.html},
year={2017}
}
open_images_v4/asli (konfigurasi default)
Deskripsi konfigurasi : Gambar pada resolusi dan kualitas aslinya.
Ukuran kumpulan data :
562.42 GiB
Gambar ( tfds.show_examples ):
- Contoh ( tfds.as_dataframe ):
open_images_v4/300k
Deskripsi konfigurasi : Gambar memiliki sekitar 300.000 piksel, dengan kualitas 72 JPEG.
Ukuran kumpulan data :
81.92 GiB
Gambar ( tfds.show_examples ):
- Contoh ( tfds.as_dataframe ):
open_images_v4/200k
Deskripsi konfigurasi : Gambar memiliki sekitar 200.000 piksel, dengan kualitas 72 JPEG.
Ukuran kumpulan data :
60.70 GiB
Gambar ( tfds.show_examples ):
- Contoh ( tfds.as_dataframe ):