tao

Keterangan :

Dataset TAO merupakan dataset deteksi objek video berukuran besar yang terdiri dari 2.907 video resolusi tinggi dan 833 kategori objek. Perlu diperhatikan bahwa kumpulan data ini memerlukan setidaknya 300 GB ruang kosong untuk disimpan.

Dokumentasi Tambahan : Jelajahi Makalah Dengan Kode
Beranda : https://taodataset.org/
Kode sumber : tfds.video.tao.Tao
Versi :
- 1.1.0 (default) : Menambahkan pemisahan tes.
Ukuran unduhan : Unknown size
Ukuran kumpulan data : Unknown size
Petunjuk pengunduhan manual : Kumpulan data ini mengharuskan Anda mengunduh data sumber secara manual ke download_config.manual_dir (defaultnya adalah ~/tensorflow_datasets/downloads/manual/ ):
Beberapa file TAO (video HVACS dan AVA) harus diunduh secara manual karena diperlukan login ke MOT. Silakan unduh dan data tersebut mengikuti petunjuk di https://motchallenge.net/tao_download.php

Unduh data ini dan pindahkan file .zip yang dihasilkan ke ~/tensorflow_datasets/downloads/manual/

Jika data yang memerlukan pengunduhan manual tidak ada, data tersebut akan dilewati dan hanya data yang tidak memerlukan pengunduhan manual yang akan digunakan.

Cache otomatis ( dokumentasi ): Tidak diketahui
Perpecahan :

Membelah	Contoh

Kunci yang diawasi (Lihat dokumen as_supervised ): None
Gambar ( tfds.show_examples ): Tidak didukung.
Contoh ( tfds.as_dataframe ): Tidak ada.
Kutipan :

@article{Dave_2020,
   title={TAO: A Large-Scale Benchmark for Tracking Any Object},
   ISBN={9783030585587},
   ISSN={1611-3349},
   url={http://dx.doi.org/10.1007/978-3-030-58558-7_26},
   DOI={10.1007/978-3-030-58558-7_26},
   journal={Lecture Notes in Computer Science},
   publisher={Springer International Publishing},
   author={Dave, Achal and Khurana, Tarasha and Tokmakov, Pavel and Schmid, Cordelia and Ramanan, Deva},
   year={2020},
   pages={436-454}
}

tao/480_640 (konfigurasi default)

Deskripsi konfigurasi : Semua gambar diubah ukurannya secara bilinear menjadi 480 X 640
Struktur fitur :

FeaturesDict({
    'metadata': FeaturesDict({
        'dataset': string,
        'height': int32,
        'neg_category_ids': Tensor(shape=(None,), dtype=int32),
        'not_exhaustive_category_ids': Tensor(shape=(None,), dtype=int32),
        'num_frames': int32,
        'video_name': string,
        'width': int32,
    }),
    'tracks': Sequence({
        'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=float32)),
        'category': ClassLabel(shape=(), dtype=int64, num_classes=363),
        'frames': Sequence(int32),
        'is_crowd': bool,
        'scale_category': string,
        'track_id': int32,
    }),
    'video': Video(Image(shape=(480, 640, 3), dtype=uint8)),
})

Dokumentasi fitur :

Fitur	Kelas	Membentuk	Tipe D
	FiturDict
metadata	FiturDict
metadata/kumpulan data	Tensor		rangkaian
metadata/tinggi	Tensor		int32
metadata/neg_category_ids	Tensor	(Tidak ada,)	int32
metadata/not_exhaustive_category_ids	Tensor	(Tidak ada,)	int32
metadata/num_frames	Tensor		int32
metadata/nama_video	Tensor		rangkaian
metadata/lebar	Tensor		int32
trek	Urutan
trek/bbox	Urutan (Fitur BBox)	(Tidak ada, 4)	float32
trek/kategori	Label Kelas		int64
trek/bingkai	Urutan (Tensor)	(Tidak ada,)	int32
trek/is_crowd	Tensor		bodoh
trek/skala_kategori	Tensor		rangkaian
trek/track_id	Tensor		int32
video	Video (Gambar)	(Tidak ada, 480, 640, 3)	uint8

tao/resolusi_penuh

Deskripsi konfigurasi : Versi resolusi penuh dari kumpulan data.
Struktur fitur :

FeaturesDict({
    'metadata': FeaturesDict({
        'dataset': string,
        'height': int32,
        'neg_category_ids': Tensor(shape=(None,), dtype=int32),
        'not_exhaustive_category_ids': Tensor(shape=(None,), dtype=int32),
        'num_frames': int32,
        'video_name': string,
        'width': int32,
    }),
    'tracks': Sequence({
        'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=float32)),
        'category': ClassLabel(shape=(), dtype=int64, num_classes=363),
        'frames': Sequence(int32),
        'is_crowd': bool,
        'scale_category': string,
        'track_id': int32,
    }),
    'video': Video(Image(shape=(None, None, 3), dtype=uint8)),
})

Dokumentasi fitur :

Fitur	Kelas	Membentuk	Tipe D
	FiturDict
metadata	FiturDict
metadata/kumpulan data	Tensor		rangkaian
metadata/tinggi	Tensor		int32
metadata/neg_category_ids	Tensor	(Tidak ada,)	int32
metadata/not_exhaustive_category_ids	Tensor	(Tidak ada,)	int32
metadata/num_frames	Tensor		int32
metadata/nama_video	Tensor		rangkaian
metadata/lebar	Tensor		int32
trek	Urutan
trek/bbox	Urutan (Fitur BBox)	(Tidak ada, 4)	float32
trek/kategori	Label Kelas		int64
trek/bingkai	Urutan (Tensor)	(Tidak ada,)	int32
trek/is_crowd	Tensor		bodoh
trek/skala_kategori	Tensor		rangkaian
trek/track_id	Tensor		int32
video	Video (Gambar)	(Tidak ada, tidak ada, tidak ada, 3)	uint8