webvid

  • Deskripsi :

WebVid adalah kumpulan data video pendek berskala besar dengan deskripsi tekstual yang bersumber dari web. Videonya beragam dan kaya akan kontennya.

WebVid-10M berisi:

10,7 juta pasang teks video. 52K total jam video.

  • Beranda : https://m-bain.github.io/webvid-dataset/

  • Kode sumber : tfds.datasets.webvid.Builder

  • Versi :

    • 1.0.0 (default): Rilis awal.
  • Ukuran unduhan : Unknown size

  • Ukuran set data : Unknown size

  • Instruksi pengunduhan manual : Kumpulan data ini mengharuskan Anda mengunduh data sumber secara manual ke download_config.manual_dir (default ke ~/tensorflow_datasets/downloads/manual/ ):
    Ikuti petunjuk pengunduhan di https://m-bain.github.io/webvid-dataset/ untuk mendapatkan datanya. Tempatkan file csv dan direktori video manual_dir/webvid , sehingga file mp4 ditempatkan manual_dir/webvid/*/*_*/*.mp4 .

Direktori pertama biasanya berupa direktori bagian arbitrer (untuk pengunduhan sharded), direktori kedua adalah direktori halaman (dua angka di sekitar garis bawah), di dalamnya terdapat satu atau lebih file mp4.

  • Di-cache otomatis ( dokumentasi ): Tidak diketahui

  • Perpecahan :

Membelah Contoh
  • Struktur fitur :
FeaturesDict({
    'caption': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
    'video': Video(Image(shape=(360, 640, 3), dtype=uint8)),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Dtype Keterangan
fiturDict
keterangan Teks rangkaian
pengenal Teks rangkaian
url Teks rangkaian
video Video(Gambar) (Tidak ada, 360, 640, 3) uint8
@misc{bain2021frozen,
      title={Frozen in Time: A Joint Video and Image Encoder for End-to-End Retrieval},
      author={Max Bain and Arsha Nagrani and Gül Varol and Andrew Zisserman},
      year={2021},
      eprint={2104.00650},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}
,

  • Deskripsi :

WebVid adalah kumpulan data video pendek berskala besar dengan deskripsi tekstual yang bersumber dari web. Videonya beragam dan kaya akan kontennya.

WebVid-10M berisi:

10,7 juta pasang teks video. 52K total jam video.

  • Beranda : https://m-bain.github.io/webvid-dataset/

  • Kode sumber : tfds.datasets.webvid.Builder

  • Versi :

    • 1.0.0 (default): Rilis awal.
  • Ukuran unduhan : Unknown size

  • Ukuran set data : Unknown size

  • Instruksi pengunduhan manual : Kumpulan data ini mengharuskan Anda mengunduh data sumber secara manual ke download_config.manual_dir (default ke ~/tensorflow_datasets/downloads/manual/ ):
    Ikuti petunjuk pengunduhan di https://m-bain.github.io/webvid-dataset/ untuk mendapatkan datanya. Tempatkan file csv dan direktori video manual_dir/webvid , sehingga file mp4 ditempatkan manual_dir/webvid/*/*_*/*.mp4 .

Direktori pertama biasanya berupa direktori bagian arbitrer (untuk pengunduhan sharded), direktori kedua adalah direktori halaman (dua angka di sekitar garis bawah), di dalamnya terdapat satu atau lebih file mp4.

  • Di-cache otomatis ( dokumentasi ): Tidak diketahui

  • Perpecahan :

Membelah Contoh
  • Struktur fitur :
FeaturesDict({
    'caption': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
    'video': Video(Image(shape=(360, 640, 3), dtype=uint8)),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Dtype Keterangan
fiturDict
keterangan Teks rangkaian
pengenal Teks rangkaian
url Teks rangkaian
video Video(Gambar) (Tidak ada, 360, 640, 3) uint8
@misc{bain2021frozen,
      title={Frozen in Time: A Joint Video and Image Encoder for End-to-End Retrieval},
      author={Max Bain and Arsha Nagrani and Gül Varol and Andrew Zisserman},
      year={2021},
      eprint={2104.00650},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}