tao

  • Mô tả :

Tập dữ liệu TAO là một tập dữ liệu phát hiện đối tượng video lớn bao gồm 2.907 video độ phân giải cao và 833 danh mục đối tượng. Lưu ý rằng tập dữ liệu này yêu cầu ít nhất 300 GB dung lượng trống để lưu trữ.

  • Trang chủ : https://taodataset.org/

  • Mã nguồn : tfds.video.tao.Tao

  • Các phiên bản :

    • 1.0.0 (mặc định): Bản phát hành ban đầu.
  • Kích thước tải xuống : 113.96 GiB

  • Hướng dẫn tải xuống thủ công: Tập dữ liệu này yêu cầu bạn tải xuống dữ liệu nguồn theo cách thủ công vào download_config.manual_dir (mặc định là ~/tensorflow_datasets/downloads/manual/ ):
    Một số tệp TAO (video HVACS và AVA) phải được tải xuống theo cách thủ công vì yêu cầu đăng nhập vào Bộ GTVT. Vui lòng tải xuống và những dữ liệu đó theo hướng dẫn tại https://motchallenge.net/tao_download.php

Tải xuống dữ liệu này và di chuyển các tệp .zip thu được sang ~ / tensorflow_datasets / Download / manual /

Nếu không có dữ liệu yêu cầu tải xuống thủ công, dữ liệu đó sẽ bị bỏ qua và chỉ dữ liệu không yêu cầu tải xuống thủ công mới được sử dụng.

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không

  • Tách :

Tách ra Các ví dụ
'train' 500
'validation' 988
@article{Dave_2020,
   title={TAO: A Large-Scale Benchmark for Tracking Any Object},
   ISBN={9783030585587},
   ISSN={1611-3349},
   url={http://dx.doi.org/10.1007/978-3-030-58558-7_26},
   DOI={10.1007/978-3-030-58558-7_26},
   journal={Lecture Notes in Computer Science},
   publisher={Springer International Publishing},
   author={Dave, Achal and Khurana, Tarasha and Tokmakov, Pavel and Schmid, Cordelia and Ramanan, Deva},
   year={2020},
   pages={436-454}
}

tao / 480_640 (cấu hình mặc định)

  • Mô tả cấu hình : Tất cả hình ảnh được thay đổi kích thước song song thành 480 X 640

  • Kích thước tập dữ liệu: 482.30 GiB

  • Cấu trúc tính năng :

FeaturesDict({
    'metadata': FeaturesDict({
        'dataset': tf.string,
        'height': tf.int32,
        'neg_category_ids': Tensor(shape=(None,), dtype=tf.int32),
        'not_exhaustive_category_ids': Tensor(shape=(None,), dtype=tf.int32),
        'num_frames': tf.int32,
        'video_name': tf.string,
        'width': tf.int32,
    }),
    'tracks': Sequence({
        'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=tf.float32)),
        'category': ClassLabel(shape=(), dtype=tf.int64, num_classes=363),
        'frames': Sequence(tf.int32),
        'is_crowd': tf.bool,
        'scale_category': tf.string,
        'track_id': tf.int32,
    }),
    'video': Video(Image(shape=(480, 640, 3), dtype=tf.uint8)),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự miêu tả
Các tính năng
metadata Các tính năng
siêu dữ liệu / tập dữ liệu Tensor tf.string
siêu dữ liệu / chiều cao Tensor tf.int32
siêu dữ liệu / neg_category_ids Tensor (Không có,) tf.int32
siêu dữ liệu / not_exhaustive_category_ids Tensor (Không có,) tf.int32
siêu dữ liệu / num_frames Tensor tf.int32
siêu dữ liệu / video_name Tensor tf.string
siêu dữ liệu / chiều rộng Tensor tf.int32
bài hát Sự liên tiếp
bài hát / bboxes Trình tự (BBoxFeature) (Không, 4) tf.float32
bài hát / danh mục ClassLabel tf.int64
bài hát / khung Trình tự (Tensor) (Không có,) tf.int32
track / is_crowd Tensor tf.bool
track / scale_category Tensor tf.string
track / track_id Tensor tf.int32
băng hình Video (Hình ảnh) (Không có, 480, 640, 3) tf.uint8

tao / full_resolution

  • Mô tả cấu hình : Phiên bản độ phân giải đầy đủ của tập dữ liệu.

  • Kích thước tập dữ liệu: 171.24 GiB

  • Cấu trúc tính năng :

FeaturesDict({
    'metadata': FeaturesDict({
        'dataset': tf.string,
        'height': tf.int32,
        'neg_category_ids': Tensor(shape=(None,), dtype=tf.int32),
        'not_exhaustive_category_ids': Tensor(shape=(None,), dtype=tf.int32),
        'num_frames': tf.int32,
        'video_name': tf.string,
        'width': tf.int32,
    }),
    'tracks': Sequence({
        'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=tf.float32)),
        'category': ClassLabel(shape=(), dtype=tf.int64, num_classes=363),
        'frames': Sequence(tf.int32),
        'is_crowd': tf.bool,
        'scale_category': tf.string,
        'track_id': tf.int32,
    }),
    'video': Video(Image(shape=(None, None, 3), dtype=tf.uint8)),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự miêu tả
Các tính năng
metadata Các tính năng
siêu dữ liệu / tập dữ liệu Tensor tf.string
siêu dữ liệu / chiều cao Tensor tf.int32
siêu dữ liệu / neg_category_ids Tensor (Không có,) tf.int32
siêu dữ liệu / not_exhaustive_category_ids Tensor (Không có,) tf.int32
siêu dữ liệu / num_frames Tensor tf.int32
siêu dữ liệu / video_name Tensor tf.string
siêu dữ liệu / chiều rộng Tensor tf.int32
bài hát Sự liên tiếp
bài hát / bboxes Trình tự (BBoxFeature) (Không, 4) tf.float32
bài hát / danh mục ClassLabel tf.int64
bài hát / khung Trình tự (Tensor) (Không có,) tf.int32
track / is_crowd Tensor tf.bool
track / scale_category Tensor tf.string
track / track_id Tensor tf.int32
băng hình Video (Hình ảnh) (Không có, Không có, Không có, 3) tf.uint8