ơn gọi

  • Mô tả :

Tập dữ liệu này chứa dữ liệu từ Thử thách các lớp đối tượng trực quan PASCAL, tương ứng với các cuộc thi Phân loại và Phát hiện.

Trong phần thi Phân loại, mục tiêu là dự đoán tập hợp các nhãn có trong hình ảnh, trong khi trong phần thi Phát hiện, mục tiêu là dự đoán hộp giới hạn và nhãn của từng đối tượng riêng lẻ. CẢNH BÁO: Theo bộ dữ liệu chính thức, bộ thử nghiệm của VOC2012 không chứa chú thích.

  • Mã nguồn : tfds.object_detection.Voc

  • Các phiên bản :

    • 4.0.0 (mặc định): Không có ghi chú phát hành.
  • Kích thước tập dữ liệu : Unknown size

  • Tự động lưu trong bộ nhớ đệm ( tài liệu ): Không xác định

  • Cấu trúc tính năng :

FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=tf.uint8),
    'image/filename': Text(shape=(), dtype=tf.string),
    'labels': Sequence(ClassLabel(shape=(), dtype=tf.int64, num_classes=20)),
    'labels_no_difficult': Sequence(ClassLabel(shape=(), dtype=tf.int64, num_classes=20)),
    'objects': Sequence({
        'bbox': BBoxFeature(shape=(4,), dtype=tf.float32),
        'is_difficult': tf.bool,
        'is_truncated': tf.bool,
        'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=20),
        'pose': ClassLabel(shape=(), dtype=tf.int64, num_classes=5),
    }),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự mô tả
Các tính năng
hình ảnh Hình ảnh (Không có, Không có, 3) tf.uint8
hình ảnh / tên tệp Chữ tf.string
nhãn mác Trình tự (ClassLabel) (Không có,) tf.int64
label_no_difficult Trình tự (ClassLabel) (Không có,) tf.int64
các đối tượng Sự phối hợp
đối tượng / bbox BBoxFeature (4,) tf.float32
đối tượng / is_difficult Tensor tf.bool
đối tượng / is_truncated Tensor tf.bool
đối tượng / nhãn ClassLabel tf.int64
đồ vật / tư thế ClassLabel tf.int64

voc / 2007 (cấu hình mặc định)

  • Mô tả cấu hình : Tập dữ liệu này chứa dữ liệu từ PASCAL Visual Object Classes Challenge 2007, hay còn gọi là VOC2007.

Tổng số 9963 hình ảnh được bao gồm trong tập dữ liệu này, trong đó mỗi hình ảnh chứa một tập hợp các đối tượng, trong số 20 lớp khác nhau, tạo nên tổng số 24640 đối tượng được chú thích.

Tách ra Các ví dụ
'test' 4.952
'train' 2.501
'validation' 2,510
  • Trích dẫn :
@misc{pascal-voc-2007,
    author = "Everingham, M. and Van~Gool, L. and Williams, C. K. I. and Winn, J. and Zisserman, A.",
    title = "The {PASCAL} {V}isual {O}bject {C}lasses {C}hallenge 2007 {(VOC2007)} {R}esults",
    howpublished = "http://www.pascal-network.org/challenges/VOC/voc2007/workshop/index.html"}

voc / 2012

  • Mô tả cấu hình : Tập dữ liệu này chứa dữ liệu từ PASCAL Visual Object Classes Challenge 2012, hay còn gọi là VOC2012.

Tổng số 11540 hình ảnh được bao gồm trong tập dữ liệu này, trong đó mỗi hình ảnh chứa một tập hợp các đối tượng, trong số 20 lớp khác nhau, tạo nên tổng số 27450 đối tượng được chú thích.

Tách ra Các ví dụ
'test' 10.991
'train' 5,717
'validation' 5,823
  • Trích dẫn :
@misc{pascal-voc-2012,
    author = "Everingham, M. and Van~Gool, L. and Williams, C. K. I. and Winn, J. and Zisserman, A.",
    title = "The {PASCAL} {V}isual {O}bject {C}lasses {C}hallenge 2012 {(VOC2012)} {R}esults",
    howpublished = "http://www.pascal-network.org/challenges/VOC/voc2012/workshop/index.html"}