webvid

 • opis :

WebVid to wielkoskalowy zbiór krótkich filmów z tekstowymi opisami pochodzącymi z sieci. Filmy są różnorodne i bogate w treść.

WebVid-10M zawiera:

10,7 mln par napisów wideo. Łącznie 52 000 godzin wideo.

 • Strona główna : https://m-bain.github.io/webvid-dataset/

 • Kod źródłowy : tfds.datasets.webvid.Builder

 • Wersje :

  • 1.0.0 (domyślnie): Wersja początkowa.
 • Rozmiar pliku do pobrania : Unknown size

 • Rozmiar zbioru danych : Unknown size

 • Instrukcje ręcznego pobierania : ten zestaw danych wymaga ręcznego pobrania danych źródłowych do download_config.manual_dir (domyślnie ~/tensorflow_datasets/downloads/manual/ ):
  Postępuj zgodnie z instrukcjami pobierania w https://m-bain.github.io/webvid-dataset/ , aby pobrać dane. Umieść pliki csv i katalogi wideo w manual_dir/webvid , tak aby pliki mp4 zostały umieszczone w manual_dir/webvid/*/*_*/*.mp4 .

Pierwszy katalog to zazwyczaj dowolny katalog części (do pobierania fragmentów), drugi katalog to katalog stron (dwie cyfry wokół podkreślenia), wewnątrz którego znajduje się jeden lub więcej plików mp4.

 • Automatyczne buforowanie ( dokumentacja ): Nieznane

 • Podziały :

Podział Przykłady
 • Struktura funkcji :
FeaturesDict({
  'caption': Text(shape=(), dtype=string),
  'id': Text(shape=(), dtype=string),
  'url': Text(shape=(), dtype=string),
  'video': Video(Image(shape=(360, 640, 3), dtype=uint8)),
})
 • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDict
podpis Tekst strunowy
ID Tekst strunowy
adres URL Tekst strunowy
wideo Wideo (obraz) (Brak, 360, 640, 3) uint8
@misc{bain2021frozen,
   title={Frozen in Time: A Joint Video and Image Encoder for End-to-End Retrieval},
   author={Max Bain and Arsha Nagrani and Gül Varol and Andrew Zisserman},
   year={2021},
   eprint={2104.00650},
   archivePrefix={arXiv},
   primaryClass={cs.CV}
}
,

 • opis :

WebVid to wielkoskalowy zbiór krótkich filmów z tekstowymi opisami pochodzącymi z sieci. Filmy są różnorodne i bogate w treść.

WebVid-10M zawiera:

10,7 mln par napisów wideo. Łącznie 52 000 godzin wideo.

 • Strona główna : https://m-bain.github.io/webvid-dataset/

 • Kod źródłowy : tfds.datasets.webvid.Builder

 • Wersje :

  • 1.0.0 (domyślnie): Wersja początkowa.
 • Rozmiar pliku do pobrania : Unknown size

 • Rozmiar zbioru danych : Unknown size

 • Instrukcje ręcznego pobierania : ten zestaw danych wymaga ręcznego pobrania danych źródłowych do download_config.manual_dir (domyślnie ~/tensorflow_datasets/downloads/manual/ ):
  Postępuj zgodnie z instrukcjami pobierania w https://m-bain.github.io/webvid-dataset/ , aby pobrać dane. Umieść pliki csv i katalogi wideo w manual_dir/webvid , tak aby pliki mp4 zostały umieszczone w manual_dir/webvid/*/*_*/*.mp4 .

Pierwszy katalog to zazwyczaj dowolny katalog części (do pobierania fragmentów), drugi katalog to katalog stron (dwie cyfry wokół podkreślenia), wewnątrz którego znajduje się jeden lub więcej plików mp4.

 • Automatyczne buforowanie ( dokumentacja ): Nieznane

 • Podziały :

Podział Przykłady
 • Struktura funkcji :
FeaturesDict({
  'caption': Text(shape=(), dtype=string),
  'id': Text(shape=(), dtype=string),
  'url': Text(shape=(), dtype=string),
  'video': Video(Image(shape=(360, 640, 3), dtype=uint8)),
})
 • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDict
podpis Tekst strunowy
ID Tekst strunowy
adres URL Tekst strunowy
wideo Wideo (obraz) (Brak, 360, 640, 3) uint8
@misc{bain2021frozen,
   title={Frozen in Time: A Joint Video and Image Encoder for End-to-End Retrieval},
   author={Max Bain and Arsha Nagrani and Gül Varol and Andrew Zisserman},
   year={2021},
   eprint={2104.00650},
   archivePrefix={arXiv},
   primaryClass={cs.CV}
}