ơn gọi

  • Mô tả :

Bộ dữ liệu này chứa dữ liệu từ Thử thách các lớp đối tượng trực quan PASCAL, tương ứng với các cuộc thi Phân loại và Phát hiện.

Trong cuộc thi Phân loại, mục tiêu là dự đoán tập hợp các nhãn có trong hình ảnh, trong khi trong cuộc thi Phát hiện, mục tiêu là dự đoán hộp giới hạn và nhãn của từng đối tượng riêng lẻ. CẢNH BÁO: Theo bộ dữ liệu chính thức, bộ thử nghiệm của VOC2012 không chứa chú thích.

FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'image/filename': Text(shape=(), dtype=string),
    'labels': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=20)),
    'labels_no_difficult': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=20)),
    'objects': Sequence({
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
        'is_difficult': bool,
        'is_truncated': bool,
        'label': ClassLabel(shape=(), dtype=int64, num_classes=20),
        'pose': ClassLabel(shape=(), dtype=int64, num_classes=5),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
hình ảnh Hình ảnh (Không, Không có, 3) uint8
hình ảnh/tên tập tin Chữ sợi dây
nhãn Trình tự (Nhãn lớp) (Không có,) int64
nhãn_không_khó Trình tự (Nhãn lớp) (Không có,) int64
các đối tượng Sự phối hợp
đối tượng/bbox Tính năng BBox (4,) phao32
đối tượng/khó khăn tenxơ bool
đối tượng/bị_cắt bớt tenxơ bool
đối tượng/nhãn LớpNhãn int64
đối tượng/tư thế LớpNhãn int64

voc/2007 (cấu hình mặc định)

  • Mô tả cấu hình : Bộ dữ liệu này chứa dữ liệu từ Thử thách các lớp đối tượng trực quan PASCAL 2007, hay còn gọi là VOC2007.

Tổng cộng có 9963 hình ảnh được bao gồm trong bộ dữ liệu này, trong đó mỗi hình ảnh chứa một tập hợp các đối tượng, trong số 20 loại khác nhau, tạo nên tổng số 24640 đối tượng được chú thích.

Tách ra ví dụ
'test' 4,952
'train' 2.501
'validation' 2.510

Hình dung

  • trích dẫn :
@misc{pascal-voc-2007,
    author = "Everingham, M. and Van~Gool, L. and Williams, C. K. I. and Winn, J. and Zisserman, A.",
    title = "The {PASCAL} {V}isual {O}bject {C}lasses {C}hallenge 2007 {(VOC2007)} {R}esults",
    howpublished = "http://www.pascal-network.org/challenges/VOC/voc2007/workshop/index.html"}

giọng hát/2012

  • Mô tả cấu hình : Tập dữ liệu này chứa dữ liệu từ Thử thách các lớp đối tượng trực quan PASCAL 2012, hay còn gọi là VOC2012.

Tổng cộng có 11540 hình ảnh được bao gồm trong bộ dữ liệu này, trong đó mỗi hình ảnh chứa một tập hợp các đối tượng, trong số 20 lớp khác nhau, tạo nên tổng số 27450 đối tượng được chú thích.

Tách ra ví dụ
'test' 10,991
'train' 5,717
'validation' 5,823

Hình dung

  • trích dẫn :
@misc{pascal-voc-2012,
    author = "Everingham, M. and Van~Gool, L. and Williams, C. K. I. and Winn, J. and Zisserman, A.",
    title = "The {PASCAL} {V}isual {O}bject {C}lasses {C}hallenge 2012 {(VOC2012)} {R}esults",
    howpublished = "http://www.pascal-network.org/challenges/VOC/voc2012/workshop/index.html"}