وب وید

  • توضیحات :

WebVid مجموعه داده ای در مقیاس بزرگ از ویدیوهای کوتاه با توضیحات متنی است که از وب منبع آن هاست. ویدیوها متنوع و از نظر محتوایی غنی هستند.

WebVid-10M شامل:

10.7 میلیون جفت شرح ویدیو. 52 هزار ساعت کلی ویدیو.

  • صفحه اصلی : https://m-bain.github.io/webvid-dataset/

  • کد منبع : tfds.datasets.webvid.Builder

  • نسخه ها :

    • 1.0.0 (پیش فرض): انتشار اولیه.
  • اندازه دانلود : Unknown size

  • اندازه مجموعه داده : Unknown size

  • دستورالعمل‌های دانلود دستی : این مجموعه داده از شما می‌خواهد که داده‌های منبع را به صورت دستی در download_config.manual_dir دانلود کنید (پیش‌فرض ~/tensorflow_datasets/downloads/manual/ ):
    دستورالعمل های دانلود را در https://m-bain.github.io/webvid-dataset/ دنبال کنید تا داده ها را دریافت کنید. فایل های csv و فهرست های ویدئویی را در manual_dir/webvid قرار دهید، به طوری که فایل های mp4 در manual_dir/webvid/*/*_*/*.mp4 قرار گیرند.

دایرکتوری اول معمولاً یک دایرکتوری قسمت دلخواه است (برای دانلود خرد شده)، دایرکتوری دوم دایرکتوری صفحه است (دو عدد در اطراف خط زیر)، که داخل آن یک یا چند فایل mp4 وجود دارد.

  • ذخیره خودکار ( اسناد ): ناشناخته

  • تقسیم ها :

شکاف مثال ها
  • ساختار ویژگی :
FeaturesDict({
    'caption': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
    'video': Video(Image(shape=(360, 640, 3), dtype=uint8)),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
عنوان متن رشته
شناسه متن رشته
آدرس اینترنتی متن رشته
ویدئو ویدئو (تصویر) (هیچ، 360، 640، 3) uint8
@misc{bain2021frozen,
      title={Frozen in Time: A Joint Video and Image Encoder for End-to-End Retrieval},
      author={Max Bain and Arsha Nagrani and Gül Varol and Andrew Zisserman},
      year={2021},
      eprint={2104.00650},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}
،

  • توضیحات :

WebVid مجموعه داده ای در مقیاس بزرگ از ویدیوهای کوتاه با توضیحات متنی است که از وب منبع آن هاست. ویدیوها متنوع و از نظر محتوایی غنی هستند.

WebVid-10M شامل:

10.7 میلیون جفت شرح ویدیو. 52 هزار ساعت کلی ویدیو.

  • صفحه اصلی : https://m-bain.github.io/webvid-dataset/

  • کد منبع : tfds.datasets.webvid.Builder

  • نسخه ها :

    • 1.0.0 (پیش فرض): انتشار اولیه.
  • اندازه دانلود : Unknown size

  • اندازه مجموعه داده : Unknown size

  • دستورالعمل‌های دانلود دستی : این مجموعه داده از شما می‌خواهد که داده‌های منبع را به صورت دستی در download_config.manual_dir دانلود کنید (پیش‌فرض ~/tensorflow_datasets/downloads/manual/ ):
    دستورالعمل های دانلود را در https://m-bain.github.io/webvid-dataset/ دنبال کنید تا داده ها را دریافت کنید. فایل های csv و فهرست های ویدئویی را در manual_dir/webvid قرار دهید، به طوری که فایل های mp4 در manual_dir/webvid/*/*_*/*.mp4 قرار گیرند.

دایرکتوری اول معمولاً یک دایرکتوری قسمت دلخواه است (برای دانلود خرد شده)، دایرکتوری دوم دایرکتوری صفحه است (دو عدد در اطراف خط زیر)، که داخل آن یک یا چند فایل mp4 وجود دارد.

  • ذخیره خودکار ( اسناد ): ناشناخته

  • تقسیمات :

شکاف مثال ها
  • ساختار ویژگی :
FeaturesDict({
    'caption': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
    'video': Video(Image(shape=(360, 640, 3), dtype=uint8)),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
عنوان متن رشته
شناسه متن رشته
آدرس اینترنتی متن رشته
ویدئو ویدئو (تصویر) (هیچ، 360، 640، 3) uint8
@misc{bain2021frozen,
      title={Frozen in Time: A Joint Video and Image Encoder for End-to-End Retrieval},
      author={Max Bain and Arsha Nagrani and Gül Varol and Andrew Zisserman},
      year={2021},
      eprint={2104.00650},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}