- תיאור :
WebVid הוא מערך נתונים בקנה מידה גדול של סרטונים קצרים עם תיאורים טקסטואליים שמקורם באינטרנט. הסרטונים מגוונים ועשירים בתוכן שלהם.
WebVid-10M מכיל:
10.7 מיליון זוגות כתוביות וידאו. 52K שעות וידאו סה"כ.
דף הבית : https://m-bain.github.io/webvid-dataset/
קוד מקור :
tfds.datasets.webvid.Builder
גרסאות :
-
1.0.0
(ברירת מחדל): שחרור ראשוני.
-
גודל הורדה :
Unknown size
גודל ערכת נתונים :
Unknown size
הוראות הורדה ידניות : מערך נתונים זה מחייב אותך להוריד את נתוני המקור באופן ידני אל
download_config.manual_dir
(ברירת המחדל היא~/tensorflow_datasets/downloads/manual/
):
עקוב אחר הוראות ההורדה ב- https://m-bain.github.io/webvid-dataset/ כדי לקבל את הנתונים. מקם את קבצי ה-csv ואת ספריות הווידאו ב-manual_dir/webvid
, כך שקובצי mp4 ממוקמים ב-manual_dir/webvid/*/*_*/*.mp4
.
הספרייה הראשונה היא בדרך כלל ספריית חלק שרירותית (להורדה מרוסקת), הספרייה השנייה היא ספריית העמודים (שני מספרים סביב קו תחתון), שבתוכה יש קובץ mp4 אחד או יותר.
שמור אוטומטי במטמון ( תיעוד ): לא ידוע
פיצולים :
לְפַצֵל | דוגמאות |
---|
- מבנה תכונה :
FeaturesDict({
'caption': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
'video': Video(Image(shape=(360, 640, 3), dtype=uint8)),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
FeaturesDict | ||||
כּוֹתֶרֶת | טֶקסט | חוּט | ||
תְעוּדַת זֶהוּת | טֶקסט | חוּט | ||
כתובת אתר | טֶקסט | חוּט | ||
וִידֵאוֹ | וידאו (תמונה) | (ללא, 360, 640, 3) | uint8 |
מפתחות בפיקוח (ראה
as_supervised
doc ):None
איור ( tfds.show_examples ): לא נתמך.
דוגמאות ( tfds.as_dataframe ): חסר.
ציטוט :
@misc{bain2021frozen,
title={Frozen in Time: A Joint Video and Image Encoder for End-to-End Retrieval},
author={Max Bain and Arsha Nagrani and Gül Varol and Andrew Zisserman},
year={2021},
eprint={2104.00650},
archivePrefix={arXiv},
primaryClass={cs.CV}
}
, - תיאור :
WebVid הוא מערך נתונים בקנה מידה גדול של סרטונים קצרים עם תיאורים טקסטואליים שמקורם באינטרנט. הסרטונים מגוונים ועשירים בתוכן שלהם.
WebVid-10M מכיל:
10.7 מיליון זוגות כתוביות וידאו. 52K שעות וידאו סה"כ.
דף הבית : https://m-bain.github.io/webvid-dataset/
קוד מקור :
tfds.datasets.webvid.Builder
גרסאות :
-
1.0.0
(ברירת מחדל): שחרור ראשוני.
-
גודל הורדה :
Unknown size
גודל ערכת נתונים :
Unknown size
הוראות הורדה ידניות : מערך נתונים זה מחייב אותך להוריד את נתוני המקור באופן ידני אל
download_config.manual_dir
(ברירת המחדל היא~/tensorflow_datasets/downloads/manual/
):
עקוב אחר הוראות ההורדה ב- https://m-bain.github.io/webvid-dataset/ כדי לקבל את הנתונים. מקם את קבצי ה-csv ואת ספריות הווידאו ב-manual_dir/webvid
, כך שקובצי mp4 ממוקמים ב-manual_dir/webvid/*/*_*/*.mp4
.
הספרייה הראשונה היא בדרך כלל ספריית חלק שרירותית (להורדה מרוסקת), הספרייה השנייה היא ספריית העמודים (שני מספרים סביב קו תחתון), שבתוכה יש קובץ mp4 אחד או יותר.
שמור אוטומטי במטמון ( תיעוד ): לא ידוע
פיצולים :
לְפַצֵל | דוגמאות |
---|
- מבנה תכונה :
FeaturesDict({
'caption': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
'video': Video(Image(shape=(360, 640, 3), dtype=uint8)),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
FeaturesDict | ||||
כּוֹתֶרֶת | טֶקסט | חוּט | ||
תְעוּדַת זֶהוּת | טֶקסט | חוּט | ||
כתובת אתר | טֶקסט | חוּט | ||
וִידֵאוֹ | וידאו (תמונה) | (ללא, 360, 640, 3) | uint8 |
מפתחות בפיקוח (ראה
as_supervised
doc ):None
איור ( tfds.show_examples ): לא נתמך.
דוגמאות ( tfds.as_dataframe ): חסר.
ציטוט :
@misc{bain2021frozen,
title={Frozen in Time: A Joint Video and Image Encoder for End-to-End Retrieval},
author={Max Bain and Arsha Nagrani and Gül Varol and Andrew Zisserman},
year={2021},
eprint={2104.00650},
archivePrefix={arXiv},
primaryClass={cs.CV}
}