tao

Sự miêu tả :

Bộ dữ liệu TAO là bộ dữ liệu phát hiện đối tượng video lớn bao gồm 2.907 video có độ phân giải cao và 833 danh mục đối tượng. Lưu ý rằng tập dữ liệu này cần ít nhất 300 GB dung lượng trống để lưu trữ.

Tài liệu bổ sung : Khám phá trên giấy tờ có mã
Trang chủ : https://taodataset.org/
Mã nguồn : tfds.video.tao.Tao
Phiên bản :
- 1.1.0 (mặc định) : Đã thêm phần chia thử nghiệm.
Kích thước tải xuống : Unknown size
Kích thước tập dữ liệu : Unknown size
Hướng dẫn tải xuống thủ công : Tập dữ liệu này yêu cầu bạn tải xuống dữ liệu nguồn theo cách thủ công vào download_config.manual_dir (mặc định là ~/tensorflow_datasets/downloads/manual/ ):
Một số tệp TAO (video HVACS và AVA) phải được tải xuống thủ công vì cần phải đăng nhập vào MOT. Vui lòng tải xuống và những dữ liệu đó theo hướng dẫn tại https://motchallenge.net/tao_download.php

Tải xuống dữ liệu này và di chuyển các tệp .zip kết quả sang ~/tensorflow_datasets/downloads/manual/

Nếu không có dữ liệu yêu cầu tải xuống thủ công, dữ liệu đó sẽ bị bỏ qua và chỉ sử dụng dữ liệu không yêu cầu tải xuống thủ công.

Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không xác định
Chia tách :

Tách ra	Ví dụ

Khóa được giám sát (Xem as_supervised doc ): None
Hình ( tfds.show_examples ): Không được hỗ trợ.
Ví dụ ( tfds.as_dataframe ): Thiếu.
Trích dẫn :

@article{Dave_2020,
   title={TAO: A Large-Scale Benchmark for Tracking Any Object},
   ISBN={9783030585587},
   ISSN={1611-3349},
   url={http://dx.doi.org/10.1007/978-3-030-58558-7_26},
   DOI={10.1007/978-3-030-58558-7_26},
   journal={Lecture Notes in Computer Science},
   publisher={Springer International Publishing},
   author={Dave, Achal and Khurana, Tarasha and Tokmakov, Pavel and Schmid, Cordelia and Ramanan, Deva},
   year={2020},
   pages={436-454}
}

tao/480_640 (cấu hình mặc định)

Mô tả cấu hình : Tất cả hình ảnh được kích thước song tuyến thành 480 X 640
Cấu trúc tính năng :

FeaturesDict({
    'metadata': FeaturesDict({
        'dataset': string,
        'height': int32,
        'neg_category_ids': Tensor(shape=(None,), dtype=int32),
        'not_exhaustive_category_ids': Tensor(shape=(None,), dtype=int32),
        'num_frames': int32,
        'video_name': string,
        'width': int32,
    }),
    'tracks': Sequence({
        'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=float32)),
        'category': ClassLabel(shape=(), dtype=int64, num_classes=363),
        'frames': Sequence(int32),
        'is_crowd': bool,
        'scale_category': string,
        'track_id': int32,
    }),
    'video': Video(Image(shape=(480, 640, 3), dtype=uint8)),
})

Tài liệu tính năng :

Tính năng	Lớp học	Hình dạng	loại D
	Tính năngDict
siêu dữ liệu	Tính năngDict
siêu dữ liệu/tập dữ liệu	Tenxơ		sợi dây
siêu dữ liệu/chiều cao	Tenxơ		int32
siêu dữ liệu/neg_category_ids	Tenxơ	(Không có,)	int32
siêu dữ liệu/not_exhaustive_category_ids	Tenxơ	(Không có,)	int32
siêu dữ liệu/num_frames	Tenxơ		int32
siêu dữ liệu/tên_video	Tenxơ		sợi dây
siêu dữ liệu/chiều rộng	Tenxơ		int32
bài hát	Sự liên tiếp
bài hát/hộp nhạc	Trình tự(BBoxFeature)	(Không có, 4)	phao32
bài hát/danh mục	Nhãn lớp		int64
bài hát/khung	Trình tự(Tensor)	(Không có,)	int32
bài hát/is_crowd	Tenxơ		bool
bài hát/scale_category	Tenxơ		sợi dây
bài hát/track_id	Tenxơ		int32
băng hình	Video(Hình ảnh)	(Không, 480, 640, 3)	uint8

tao/full_độ phân giải

Mô tả cấu hình : Phiên bản có độ phân giải đầy đủ của tập dữ liệu.
Cấu trúc tính năng :

FeaturesDict({
    'metadata': FeaturesDict({
        'dataset': string,
        'height': int32,
        'neg_category_ids': Tensor(shape=(None,), dtype=int32),
        'not_exhaustive_category_ids': Tensor(shape=(None,), dtype=int32),
        'num_frames': int32,
        'video_name': string,
        'width': int32,
    }),
    'tracks': Sequence({
        'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=float32)),
        'category': ClassLabel(shape=(), dtype=int64, num_classes=363),
        'frames': Sequence(int32),
        'is_crowd': bool,
        'scale_category': string,
        'track_id': int32,
    }),
    'video': Video(Image(shape=(None, None, 3), dtype=uint8)),
})

Tài liệu tính năng :

Tính năng	Lớp học	Hình dạng	loại D
	Tính năngDict
siêu dữ liệu	Tính năngDict
siêu dữ liệu/tập dữ liệu	Tenxơ		sợi dây
siêu dữ liệu/chiều cao	Tenxơ		int32
siêu dữ liệu/neg_category_ids	Tenxơ	(Không có,)	int32
siêu dữ liệu/not_exhaustive_category_ids	Tenxơ	(Không có,)	int32
siêu dữ liệu/num_frames	Tenxơ		int32
siêu dữ liệu/tên_video	Tenxơ		sợi dây
siêu dữ liệu/chiều rộng	Tenxơ		int32
bài hát	Sự liên tiếp
bài hát/hộp nhạc	Trình tự(BBoxFeature)	(Không có, 4)	phao32
bài hát/danh mục	Nhãn lớp		int64
bài hát/khung	Trình tự(Tensor)	(Không có,)	int32
bài hát/is_crowd	Tenxơ		bool
bài hát/scale_category	Tenxơ		sợi dây
bài hát/track_id	Tenxơ		int32
băng hình	Video(Hình ảnh)	(Không, Không, Không, 3)	uint8