open_images_challenge2019_detection

  • Description :

Open Images est une version collaborative d'environ 9 millions d'images annotées avec des étiquettes au niveau de l'image, des cadres de délimitation d'objets, des masques de segmentation d'objets et des relations visuelles. Cet ensemble de données particulièrement vaste et diversifié est conçu pour stimuler les avancées de pointe dans l’analyse et la compréhension des images.

Celui-ci contient les données de la piste de détection d'objets de la compétition. L'objectif de cette piste est de prédire un cadre de délimitation étroit autour de toutes les instances d'objets de 500 classes.

Les images sont annotées avec des étiquettes de niveau image positives, indiquant que certaines classes d'objets sont présentes, et avec des étiquettes de niveau image négatives, indiquant que certaines classes sont absentes. Dans le cadre du concours, toutes les autres classes non annotées sont exclues de l'évaluation dans cette image. Pour chaque étiquette positive au niveau de l’image dans une image, chaque instance de cette classe d’objet dans l’image a été annotée.

Diviser Exemples
'test' 99 999
'train' 1 743 042
'validation' 41 620
  • Structure des fonctionnalités :
FeaturesDict({
    'bobjects': Sequence({
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
        'is_group_of': bool,
        'label': ClassLabel(shape=(), dtype=int64, num_classes=500),
    }),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'objects': Sequence({
        'confidence': float32,
        'label': ClassLabel(shape=(), dtype=int64, num_classes=500),
        'source': Text(shape=(), dtype=string),
    }),
})
  • Documentation des fonctionnalités :
Fonctionnalité Classe Forme Type D Description
FonctionnalitésDict
bobjets Séquence
bobjets/bbox Fonctionnalité BBox (4,) flotteur32
bobjects/is_group_of Tenseur bouffon
bobjets/étiquette Étiquette de classe int64
identifiant Texte chaîne
image Image (Aucun, Aucun, 3) uint8
objets Séquence
objets/confiance Tenseur flotteur32
objets/étiquette Étiquette de classe int64
objets/source Texte chaîne

open_images_challenge2019_detection/200k (configuration par défaut)

  • Description de la configuration : Les images ont au maximum 200 000 pixels, en qualité 72 JPEG.

  • Taille de l'ensemble de données : 59.06 GiB

  • Figure ( tfds.show_examples ) :

Visualisation

open_images_challenge2019_detection/300k

  • Description de la configuration : Les images ont au maximum 300 000 pixels, en qualité 72 JPEG.

  • Taille de l'ensemble de données : 80.10 GiB

  • Figure ( tfds.show_examples ) :

Visualisation