webvid

  • תיאור :

WebVid הוא מערך נתונים בקנה מידה גדול של סרטונים קצרים עם תיאורים טקסטואליים שמקורם באינטרנט. הסרטונים מגוונים ועשירים בתוכן שלהם.

WebVid-10M מכיל:

10.7 מיליון זוגות כתוביות וידאו. 52K שעות וידאו סה"כ.

  • דף הבית : https://m-bain.github.io/webvid-dataset/

  • קוד מקור : tfds.datasets.webvid.Builder

  • גרסאות :

    • 1.0.0 (ברירת מחדל): שחרור ראשוני.
  • גודל הורדה : Unknown size

  • גודל ערכת נתונים : Unknown size

  • הוראות הורדה ידניות : מערך נתונים זה מחייב אותך להוריד את נתוני המקור באופן ידני אל download_config.manual_dir (ברירת המחדל היא ~/tensorflow_datasets/downloads/manual/ ):
    עקוב אחר הוראות ההורדה ב- https://m-bain.github.io/webvid-dataset/ כדי לקבל את הנתונים. מקם את קבצי ה-csv ואת ספריות הווידאו ב- manual_dir/webvid , כך שקובצי mp4 ממוקמים ב- manual_dir/webvid/*/*_*/*.mp4 .

הספרייה הראשונה היא בדרך כלל ספריית חלק שרירותית (להורדה מרוסקת), הספרייה השנייה היא ספריית העמודים (שני מספרים סביב קו תחתון), שבתוכה יש קובץ mp4 אחד או יותר.

  • שמור אוטומטי במטמון ( תיעוד ): לא ידוע

  • פיצולים :

לְפַצֵל דוגמאות
  • מבנה תכונה :
FeaturesDict({
    'caption': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
    'video': Video(Image(shape=(360, 640, 3), dtype=uint8)),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
כּוֹתֶרֶת טֶקסט חוּט
תְעוּדַת זֶהוּת טֶקסט חוּט
כתובת אתר טֶקסט חוּט
וִידֵאוֹ וידאו (תמונה) (ללא, 360, 640, 3) uint8
@misc{bain2021frozen,
      title={Frozen in Time: A Joint Video and Image Encoder for End-to-End Retrieval},
      author={Max Bain and Arsha Nagrani and Gül Varol and Andrew Zisserman},
      year={2021},
      eprint={2104.00650},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}
,

  • תיאור :

WebVid הוא מערך נתונים בקנה מידה גדול של סרטונים קצרים עם תיאורים טקסטואליים שמקורם באינטרנט. הסרטונים מגוונים ועשירים בתוכן שלהם.

WebVid-10M מכיל:

10.7 מיליון זוגות כתוביות וידאו. 52K שעות וידאו סה"כ.

  • דף הבית : https://m-bain.github.io/webvid-dataset/

  • קוד מקור : tfds.datasets.webvid.Builder

  • גרסאות :

    • 1.0.0 (ברירת מחדל): שחרור ראשוני.
  • גודל הורדה : Unknown size

  • גודל ערכת נתונים : Unknown size

  • הוראות הורדה ידניות : מערך נתונים זה מחייב אותך להוריד את נתוני המקור באופן ידני אל download_config.manual_dir (ברירת המחדל היא ~/tensorflow_datasets/downloads/manual/ ):
    עקוב אחר הוראות ההורדה ב- https://m-bain.github.io/webvid-dataset/ כדי לקבל את הנתונים. מקם את קבצי ה-csv ואת ספריות הווידאו ב- manual_dir/webvid , כך שקובצי mp4 ממוקמים ב- manual_dir/webvid/*/*_*/*.mp4 .

הספרייה הראשונה היא בדרך כלל ספריית חלק שרירותית (להורדה מרוסקת), הספרייה השנייה היא ספריית העמודים (שני מספרים סביב קו תחתון), שבתוכה יש קובץ mp4 אחד או יותר.

  • שמור אוטומטי במטמון ( תיעוד ): לא ידוע

  • פיצולים :

לְפַצֵל דוגמאות
  • מבנה תכונה :
FeaturesDict({
    'caption': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
    'video': Video(Image(shape=(360, 640, 3), dtype=uint8)),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
כּוֹתֶרֶת טֶקסט חוּט
תְעוּדַת זֶהוּת טֶקסט חוּט
כתובת אתר טֶקסט חוּט
וִידֵאוֹ וידאו (תמונה) (ללא, 360, 640, 3) uint8
@misc{bain2021frozen,
      title={Frozen in Time: A Joint Video and Image Encoder for End-to-End Retrieval},
      author={Max Bain and Arsha Nagrani and Gül Varol and Andrew Zisserman},
      year={2021},
      eprint={2104.00650},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}