open_images_challenge2019_detection

Open Images est une version collaborative d'environ 9 millions d'images annotées avec des étiquettes au niveau de l'image, des cadres de délimitation d'objets, des masques de segmentation d'objets et des relations visuelles. Cet ensemble de données unique, vaste et diversifié, est conçu pour stimuler les avancées de pointe dans l'analyse et la compréhension des images.

Celui-ci contient les données de la piste de détection d'objets de la compétition. L'objectif de cette piste est de prédire une boîte englobante étroite autour de toutes les instances d'objet de 500 classes.

Les images sont annotées avec des étiquettes positives au niveau de l'image, indiquant que certaines classes d'objets sont présentes, et avec des étiquettes négatives au niveau de l'image, indiquant que certaines classes sont absentes. Dans le concours, toutes les autres classes non annotées sont exclues de l'évaluation dans cette image. Pour chaque étiquette positive au niveau de l'image dans une image, chaque instance de cette classe d'objets dans l'image a été annotée.

Diviser Exemples
'test' 99 999
'train' 1 743 042
'validation' 41 620
  • Structure des fonctionnalités :
FeaturesDict({
    'bobjects': Sequence({
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
        'is_group_of': bool,
        'label': ClassLabel(shape=(), dtype=int64, num_classes=500),
    }),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'objects': Sequence({
        'confidence': float32,
        'label': ClassLabel(shape=(), dtype=int64, num_classes=500),
        'source': Text(shape=(), dtype=string),
    }),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
bobjets Séquence
bobjets/bbox BBoxFeature (4,) float32
bobjects/est_group_of Tenseur bourdonner
bobjets/étiquette Étiquette de classe int64
identifiant Texte chaîne de caractères
image Image (Aucun, Aucun, 3) uint8
objets Séquence
objets/confiance Tenseur float32
objets/étiquette Étiquette de classe int64
objets/source Texte chaîne de caractères

open_images_challenge2019_detection/200k (configuration par défaut)

  • Description de la configuration : Les images ont au maximum 200 000 pixels, en qualité JPEG 72.

  • Taille du jeu de données : 59.06 GiB

  • Figure ( tfds.show_examples ):

Visualisation

open_images_challenge2019_detection/300k

  • Description de la configuration : Les images ont au maximum 300 000 pixels, en qualité JPEG 72.

  • Taille du jeu de données : 80.10 GiB

  • Figure ( tfds.show_examples ):

Visualisation