- Deskripsi :
Kumpulan data ini berisi data dari Tantangan Kelas Objek Visual PASCAL, sesuai dengan kompetisi Klasifikasi dan Deteksi.
Dalam kompetisi Klasifikasi, tujuannya adalah untuk memprediksi kumpulan label yang terdapat dalam gambar, sedangkan dalam kompetisi Deteksi tujuannya adalah untuk memprediksi kotak pembatas dan label dari masing-masing objek. PERINGATAN: Sesuai dataset resmi, set pengujian VOC2012 tidak berisi anotasi.
Dokumentasi Tambahan : Jelajahi di Makalah Dengan Kode
Kode sumber :
tfds.object_detection.Voc
Versi :
-
4.0.0
(default): Tidak ada catatan rilis.
-
Di-cache otomatis ( dokumentasi ): Tidak
Struktur fitur :
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/filename': Text(shape=(), dtype=string),
'labels': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=20)),
'labels_no_difficult': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=20)),
'objects': Sequence({
'bbox': BBoxFeature(shape=(4,), dtype=float32),
'is_difficult': bool,
'is_truncated': bool,
'label': ClassLabel(shape=(), dtype=int64, num_classes=20),
'pose': ClassLabel(shape=(), dtype=int64, num_classes=5),
}),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
fiturDict | ||||
gambar | Gambar | (Tidak ada, Tidak ada, 3) | uint8 | |
gambar/nama file | Teks | rangkaian | ||
label | Urutan(Label Kelas) | (Tidak ada,) | int64 | |
labels_no_difficult | Urutan(Label Kelas) | (Tidak ada,) | int64 | |
objek | Urutan | |||
benda/bbox | Fitur BBox | (4,) | float32 | |
objek/is_difficult | Tensor | bool | ||
objek/is_truncated | Tensor | bool | ||
benda/label | LabelKelas | int64 | ||
benda/pose | LabelKelas | int64 |
- Kunci yang diawasi (Lihat
as_supervised
doc ):None
voc/2007 (konfigurasi default)
- Deskripsi konfigurasi : Dataset ini berisi data dari PASCAL Visual Object Classes Challenge 2007, alias VOC2007.
Sebanyak 9963 gambar disertakan dalam kumpulan data ini, di mana setiap gambar berisi satu set objek, dari 20 kelas yang berbeda, sehingga total objek beranotasi menjadi 24640.
Ukuran unduhan :
868.85 MiB
Ukuran dataset :
837.73 MiB
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 4.952 |
'train' | 2.501 |
'validation' | 2.510 |
- Gambar ( tfds.show_examples ):
- Contoh ( tfds.as_dataframe ):
- Kutipan :
@misc{pascal-voc-2007,
author = "Everingham, M. and Van~Gool, L. and Williams, C. K. I. and Winn, J. and Zisserman, A.",
title = "The {PASCAL} {V}isual {O}bject {C}lasses {C}hallenge 2007 {(VOC2007)} {R}esults",
howpublished = "http://www.pascal-network.org/challenges/VOC/voc2007/workshop/index.html"}
voc/2012
- Deskripsi konfigurasi : Dataset ini berisi data dari PASCAL Visual Object Classes Challenge 2012, alias VOC2012.
Sebanyak 11540 gambar disertakan dalam kumpulan data ini, di mana setiap gambar berisi satu set objek, dari 20 kelas yang berbeda, sehingga total objek beranotasi menjadi 27450.
Ukuran unduhan :
3.59 GiB
Ukuran dataset :
2.44 GiB
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 10.991 |
'train' | 5.717 |
'validation' | 5.823 |
- Gambar ( tfds.show_examples ):
- Contoh ( tfds.as_dataframe ):
- Kutipan :
@misc{pascal-voc-2012,
author = "Everingham, M. and Van~Gool, L. and Williams, C. K. I. and Winn, J. and Zisserman, A.",
title = "The {PASCAL} {V}isual {O}bject {C}lasses {C}hallenge 2012 {(VOC2012)} {R}esults",
howpublished = "http://www.pascal-network.org/challenges/VOC/voc2012/workshop/index.html"}