open_images_challenge2019_detection

Hình ảnh mở là bản phát hành hợp tác của ~ 9 triệu hình ảnh được chú thích bằng nhãn cấp hình ảnh, hộp giới hạn đối tượng, mặt nạ phân đoạn đối tượng và các mối quan hệ trực quan. Bộ dữ liệu lớn và đa dạng độc đáo này được thiết kế để thúc đẩy những tiến bộ hiện đại trong việc phân tích và hiểu hình ảnh.

Điều này chứa dữ liệu từ bản theo dõi Phát hiện Đối tượng của cuộc thi. Mục tiêu trong bài hát này là dự đoán một hộp giới hạn chặt chẽ xung quanh tất cả các phiên bản đối tượng của 500 lớp.

Các hình ảnh được chú thích với nhãn mức hình ảnh dương, cho biết một số lớp đối tượng nhất định đang hiện diện và với nhãn mức hình ảnh âm, cho biết một số lớp nhất định không có. Trong cuộc thi, tất cả các lớp không có chú thích khác đều bị loại khỏi đánh giá trong hình ảnh đó. Đối với mỗi nhãn mức hình ảnh dương trong một hình ảnh, mọi phiên bản của lớp đối tượng đó trong hình ảnh đều được chú thích.

Tách ra Các ví dụ
'test' 99,999
'train' 1.743.042
'validation' 41.620
  • Cấu trúc tính năng :
FeaturesDict({
    'bobjects': Sequence({
        'bbox': BBoxFeature(shape=(4,), dtype=tf.float32),
        'is_group_of': tf.bool,
        'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=500),
    }),
    'id': Text(shape=(), dtype=tf.string),
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'objects': Sequence({
        'confidence': tf.float32,
        'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=500),
        'source': Text(shape=(), dtype=tf.string),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự mô tả
Các tính năng
bobjects Sự phối hợp
bobjects / bbox BBoxFeature (4,) tf.float32
bobjects / is_group_of Tensor tf.bool
bobjects / nhãn ClassLabel tf.int64
Tôi Chữ tf.string
hình ảnh Hình ảnh (Không có, Không có, 3) tf.uint8
các đối tượng Sự phối hợp
đối tượng / sự tự tin Tensor tf.float32
đối tượng / nhãn ClassLabel tf.int64
đối tượng / nguồn Chữ tf.string

open_images_challenge2019_detection / 200k (cấu hình mặc định)

  • Mô tả cấu hình : Hình ảnh có tối đa 200.000 pixel, ở chất lượng 72 JPEG.

  • Kích thước tập dữ liệu: 59.40 GiB

open_images_challenge2019_detection / 300k

  • Mô tả cấu hình : Hình ảnh có tối đa 300.000 pixel, ở chất lượng 72 JPEG.

  • Kích thước tập dữ liệu: 80.44 GiB