open_images_challenge2019_detection

Open Images è una versione collaborativa di circa 9 milioni di immagini annotate con etichette a livello di immagine, riquadri di delimitazione degli oggetti, maschere di segmentazione degli oggetti e relazioni visive. Questo set di dati straordinariamente ampio e diversificato è progettato per stimolare progressi all'avanguardia nell'analisi e nella comprensione delle immagini.

Contiene i dati della traccia Object Detection della competizione. L'obiettivo in questa traccia è prevedere un riquadro di delimitazione stretto attorno a tutte le istanze di oggetti di 500 classi.

Le immagini sono annotate con etichette positive a livello di immagine, che indicano la presenza di determinate classi di oggetti, e con etichette negative a livello di immagine, che indicano l'assenza di determinate classi. Nella competizione, tutte le altre classi non annotate sono escluse dalla valutazione in quell'immagine. Per ogni etichetta a livello di immagine positiva in un'immagine, ogni istanza di quella classe di oggetti nell'immagine è stata annotata.

Diviso Esempi
'test' 99.999
'train' 1.743.042
'validation' 41.620
  • Struttura delle caratteristiche :
FeaturesDict({
    'bobjects': Sequence({
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
        'is_group_of': bool,
        'label': ClassLabel(shape=(), dtype=int64, num_classes=500),
    }),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'objects': Sequence({
        'confidence': float32,
        'label': ClassLabel(shape=(), dtype=int64, num_classes=500),
        'source': Text(shape=(), dtype=string),
    }),
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
oggetti Sequenza
oggetti/bbox Funzionalità BBox (4,) galleggiante32
booggetti/è_gruppo_di Tensore bool
oggetti/etichetta ClassLabel int64
id Testo corda
Immagine Immagine (Nessuno, Nessuno, 3) uint8
oggetti Sequenza
oggetti/fiducia Tensore galleggiante32
oggetti/etichetta ClassLabel int64
oggetti/sorgente Testo corda

open_images_challenge2019_detection/200k (configurazione predefinita)

  • Descrizione della configurazione : le immagini hanno al massimo 200.000 pixel, con qualità 72 JPEG.

  • Dimensione del set di dati: 59.06 GiB

  • Figura ( tfds.show_examples ):

Visualizzazione

open_images_challenge2019_detection/300k

  • Descrizione della configurazione : le immagini hanno al massimo 300.000 pixel, con qualità 72 JPEG.

  • Dimensione del set di dati: 80.10 GiB

  • Figura ( tfds.show_examples ):

Visualizzazione