open_images_challenge2019_Detection

  • Sự miêu tả :

Open Images là bản phát hành hợp tác của ~9 triệu hình ảnh được chú thích bằng nhãn cấp độ hình ảnh, hộp giới hạn đối tượng, mặt nạ phân đoạn đối tượng và các mối quan hệ trực quan. Bộ dữ liệu đa dạng và lớn độc đáo này được thiết kế để thúc đẩy những tiến bộ hiện đại trong việc phân tích và hiểu hình ảnh.

Phần này chứa dữ liệu từ quá trình Phát hiện đối tượng của cuộc thi. Mục tiêu của bước này là dự đoán một hộp giới hạn chặt chẽ xung quanh tất cả các phiên bản đối tượng của 500 lớp.

Các hình ảnh được chú thích bằng nhãn cấp độ hình ảnh dương, cho biết có một số lớp đối tượng nhất định và bằng nhãn cấp độ hình ảnh âm, cho biết một số lớp nhất định không có. Trong cuộc thi, tất cả các lớp không được chú thích khác đều bị loại khỏi quá trình đánh giá trong hình ảnh đó. Đối với mỗi nhãn cấp độ hình ảnh tích cực trong một hình ảnh, mọi phiên bản của lớp đối tượng đó trong hình ảnh đều được chú thích.

Tách ra Ví dụ
'test' 99.999
'train' 1.743.042
'validation' 41.620
  • Cấu trúc tính năng :
FeaturesDict({
   
'bobjects': Sequence({
       
'bbox': BBoxFeature(shape=(4,), dtype=float32),
       
'is_group_of': bool,
       
'label': ClassLabel(shape=(), dtype=int64, num_classes=500),
   
}),
   
'id': Text(shape=(), dtype=string),
   
'image': Image(shape=(None, None, 3), dtype=uint8),
   
'objects': Sequence({
       
'confidence': float32,
       
'label': ClassLabel(shape=(), dtype=int64, num_classes=500),
       
'source': Text(shape=(), dtype=string),
   
}),
})
  • Tài liệu tính năng :
Tính năng Lớp học Hình dạng loại D Sự miêu tả
Tính năngDict
đồ vật Sự liên tiếp
bobjects/bbox Tính năng BBox (4,) phao32
đối tượng/is_group_of Tenxơ bool
đối tượng/nhãn Nhãn lớp int64
nhận dạng Chữ sợi dây
hình ảnh Hình ảnh (Không, Không, 3) uint8
các đối tượng Sự liên tiếp
đồ vật/sự tự tin Tenxơ phao32
đồ vật/nhãn Nhãn lớp int64
đối tượng/nguồn Chữ sợi dây

open_images_challenge2019_Detection/200k (cấu hình mặc định)

  • Mô tả cấu hình : Hình ảnh có tối đa 200.000 pixel, chất lượng 72 JPEG.

  • Kích thước tập dữ liệu : 59.06 GiB

  • Hình ( tfds.show_examples ):

Hình dung

open_images_challenge2019_Detection/300k

  • Mô tả cấu hình : Hình ảnh có tối đa 300.000 pixel, chất lượng 72 JPEG.

  • Kích thước tập dữ liệu : 80.10 GiB

  • Hình ( tfds.show_examples ):

Hình dung