- Açıklama :
WebVid, web'den alınan metin açıklamaları içeren kısa videolardan oluşan büyük ölçekli bir veri kümesidir. Videolar içerik olarak çeşitli ve zengindir.
WebVid-10M şunları içerir:
10,7 milyon video altyazı çifti. 52K toplam video saati.
Ana Sayfa : https://m-bain.github.io/webvid-dataset/
Kaynak kodu :
tfds.datasets.webvid.Buildersürümler :
-
1.0.0(varsayılan): İlk sürüm.
-
İndirme boyutu :
Unknown sizeVeri kümesi boyutu :
Unknown sizeManuel indirme talimatları : Bu veri kümesi, kaynak verileri manuel olarak
download_config.manual_diriçine indirmenizi gerektirir (varsayılan olarak~/tensorflow_datasets/downloads/manual/şeklindedir):
Verileri almak için https://m-bain.github.io/webvid-dataset/ adresindeki indirme talimatlarını izleyin. csv dosyalarını ve video dizinlerinimanual_dir/webvidiçine yerleştirin, böylece mp4 dosyalarımanual_dir/webvid/*/*_*/*.mp4içine yerleştirilir.
Birinci dizin tipik olarak isteğe bağlı bir parça dizini (parçalı indirme için), ikinci dizin ise içinde bir veya daha fazla mp4 dosyası bulunan sayfa dizinidir (alt çizgi etrafında iki sayı).
Otomatik önbelleğe alınmış ( belgeler ): Bilinmiyor
bölmeler :
| Bölmek | örnekler |
|---|
- Özellik yapısı :
FeaturesDict({
'caption': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
'video': Video(Image(shape=(360, 640, 3), dtype=uint8)),
})
- Özellik belgeleri :
| Özellik | Sınıf | Şekil | Dtipi | Tanım |
|---|---|---|---|---|
| ÖzelliklerDict | ||||
| altyazı | Metin | sicim | ||
| İD | Metin | sicim | ||
| url | Metin | sicim | ||
| video | Video(Resim) | (Yok, 360, 640, 3) | uint8 |
Denetlenen anahtarlar (Bkz.
as_superviseddoc ):NoneŞekil ( tfds.show_examples ): Desteklenmiyor.
Örnekler ( tfds.as_dataframe ): Eksik.
Alıntı :
@misc{bain2021frozen,
title={Frozen in Time: A Joint Video and Image Encoder for End-to-End Retrieval},
author={Max Bain and Arsha Nagrani and Gül Varol and Andrew Zisserman},
year={2021},
eprint={2104.00650},
archivePrefix={arXiv},
primaryClass={cs.CV}
}
, - Açıklama :
WebVid, web'den alınan metin açıklamaları içeren kısa videolardan oluşan büyük ölçekli bir veri kümesidir. Videolar içerik olarak çeşitli ve zengindir.
WebVid-10M şunları içerir:
10,7 milyon video altyazı çifti. 52K toplam video saati.
Ana Sayfa : https://m-bain.github.io/webvid-dataset/
Kaynak kodu :
tfds.datasets.webvid.Buildersürümler :
-
1.0.0(varsayılan): İlk sürüm.
-
İndirme boyutu :
Unknown sizeVeri kümesi boyutu :
Unknown sizeManuel indirme talimatları : Bu veri kümesi, kaynak verileri manuel olarak
download_config.manual_diriçine indirmenizi gerektirir (varsayılan olarak~/tensorflow_datasets/downloads/manual/şeklindedir):
Verileri almak için https://m-bain.github.io/webvid-dataset/ adresindeki indirme talimatlarını izleyin. csv dosyalarını ve video dizinlerinimanual_dir/webvidiçine yerleştirin, böylece mp4 dosyalarımanual_dir/webvid/*/*_*/*.mp4içine yerleştirilir.
Birinci dizin tipik olarak isteğe bağlı bir parça dizini (parçalı indirme için), ikinci dizin ise içinde bir veya daha fazla mp4 dosyası bulunan sayfa dizinidir (alt çizgi etrafında iki sayı).
Otomatik önbelleğe alınmış ( belgeleme ): Bilinmiyor
bölmeler :
| Bölmek | örnekler |
|---|
- Özellik yapısı :
FeaturesDict({
'caption': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
'video': Video(Image(shape=(360, 640, 3), dtype=uint8)),
})
- Özellik belgeleri :
| Özellik | Sınıf | Şekil | Dtipi | Tanım |
|---|---|---|---|---|
| ÖzelliklerDict | ||||
| altyazı | Metin | sicim | ||
| İD | Metin | sicim | ||
| url | Metin | sicim | ||
| video | Video(Resim) | (Yok, 360, 640, 3) | uint8 |
Denetlenen anahtarlar (Bkz.
as_superviseddoc ):NoneŞekil ( tfds.show_examples ): Desteklenmiyor.
Örnekler ( tfds.as_dataframe ): Eksik.
Alıntı :
@misc{bain2021frozen,
title={Frozen in Time: A Joint Video and Image Encoder for End-to-End Retrieval},
author={Max Bain and Arsha Nagrani and Gül Varol and Andrew Zisserman},
year={2021},
eprint={2104.00650},
archivePrefix={arXiv},
primaryClass={cs.CV}
}