open_images_challenge2019_Detection

Hình ảnh mở là một bản phát hành hợp tác gồm ~9 triệu hình ảnh được chú thích bằng nhãn cấp độ hình ảnh, hộp giới hạn đối tượng, mặt nạ phân đoạn đối tượng và các mối quan hệ trực quan. Bộ dữ liệu lớn và đa dạng độc đáo này được thiết kế để thúc đẩy những tiến bộ hiện đại trong việc phân tích và hiểu hình ảnh.

Điều này chứa dữ liệu từ bản nhạc Phát hiện đối tượng của cuộc thi. Mục tiêu trong phần này là dự đoán một hộp giới hạn chặt chẽ xung quanh tất cả các thể hiện đối tượng của 500 lớp.

Các hình ảnh được chú thích với các nhãn cấp độ hình ảnh tích cực, cho biết các lớp đối tượng nhất định có mặt và với các nhãn cấp độ hình ảnh tiêu cực, cho biết các lớp nhất định không có. Trong cuộc thi, tất cả các lớp không được chú thích khác sẽ bị loại khỏi đánh giá trong hình ảnh đó. Đối với mỗi nhãn mức hình ảnh tích cực trong một hình ảnh, mọi thể hiện của lớp đối tượng đó trong hình ảnh đều được chú thích.

Tách ra ví dụ
'test' 99,999
'train' 1.743.042
'validation' 41,620
  • Cấu trúc tính năng :
FeaturesDict({
    'bobjects': Sequence({
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
        'is_group_of': bool,
        'label': ClassLabel(shape=(), dtype=int64, num_classes=500),
    }),
    'id': Text(shape=(), dtype=string),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'objects': Sequence({
        'confidence': float32,
        'label': ClassLabel(shape=(), dtype=int64, num_classes=500),
        'source': Text(shape=(), dtype=string),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
đối tượng Sự phối hợp
đối tượng/bbox Tính năng BBox (4,) phao32
đối tượng/is_group_of tenxơ bool
đối tượng/nhãn LớpNhãn int64
Tôi Chữ sợi dây
hình ảnh Hình ảnh (Không, Không có, 3) uint8
các đối tượng Sự phối hợp
đối tượng / sự tự tin tenxơ phao32
đối tượng/nhãn LớpNhãn int64
đối tượng/nguồn Chữ sợi dây

open_images_challenge2019_detection/200k (cấu hình mặc định)

  • Mô tả cấu hình : Hình ảnh có tối đa 200.000 pixel, ở chất lượng 72 JPEG.

  • Kích thước tập dữ liệu : 59.06 GiB

  • Hình ( tfds.show_examples ):

Hình dung

open_images_challenge2019_detection/300k

  • Mô tả cấu hình : Hình ảnh có tối đa 300.000 pixel, ở chất lượng 72 JPEG.

  • Kích thước tập dữ liệu : 80.10 GiB

  • Hình ( tfds.show_examples ):

Hình dung