open_images_challenge2019_detection

Açık Görüntüler, görüntü düzeyinde etiketler, nesne sınırlayıcı kutular, nesne bölümleme maskeleri ve görsel ilişkilerle açıklama eklenmiş ~9 milyon görüntünün işbirlikçi bir sürümüdür. Bu benzersiz büyüklükteki ve çeşitliliğe sahip veri kümesi, görüntüleri analiz etme ve anlama konusunda son teknoloji ilerlemeleri teşvik etmek için tasarlanmıştır.

Bu, yarışmanın Nesne Algılama kanalından alınan verileri içerir. Bu yoldaki amaç, 500 sınıfın tüm nesne örnekleri etrafında sıkı bir sınırlayıcı kutu tahmin etmektir.

Görüntüler, belirli nesne sınıflarının mevcut olduğunu gösteren pozitif görüntü seviyesi etiketleriyle ve belirli sınıfların bulunmadığını gösteren negatif görüntü seviyesi etiketleriyle açıklanır. Yarışmada, diğer tüm açıklamasız sınıflar o görselde değerlendirme dışı bırakılır. Bir görüntüdeki her pozitif görüntü seviyesi etiketi için, görüntüdeki o nesne sınıfının her örneği açıklamalıydı.

Bölmek örnekler
'test' 99.999
'train' 1.743.042
'validation' 41.620
  • Özellik yapısı :
FeaturesDict({
    'bobjects': Sequence({
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
        'is_group_of': bool,
        'label': ClassLabel(shape=(), dtype=int64, num_classes=500),
    }),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'objects': Sequence({
        'confidence': float32,
        'label': ClassLabel(shape=(), dtype=int64, num_classes=500),
        'source': Text(shape=(), dtype=string),
    }),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
Bobjects Sekans
bobjects/bbox BBoxÖzelliği (4,) şamandıra32
bobjects/is_group_of tensör bool
nesneler/etiket SınıfEtiketi int64
İD Metin sicim
resim resim (Yok, Yok, 3) uint8
nesneler Sekans
nesneler/güven tensör şamandıra32
nesneler/etiket SınıfEtiketi int64
nesneler/kaynak Metin sicim

open_images_challenge2019_detection/200k (varsayılan yapılandırma)

  • Yapılandırma açıklaması : Görüntüler, 72 JPEG kalitesinde en fazla 200.000 piksele sahiptir.

  • Veri kümesi boyutu : 59.06 GiB

  • Şekil ( tfds.show_examples ):

görselleştirme

open_images_challenge2019_detection/300k

  • Yapılandırma açıklaması : Görüntüler, 72 JPEG kalitesinde en fazla 300.000 piksele sahiptir.

  • Veri kümesi boyutu : 80.10 GiB

  • Şekil ( tfds.show_examples ):

görselleştirme