- คำอธิบาย :
WebVid เป็นชุดข้อมูลขนาดใหญ่ของวิดีโอขนาดสั้นพร้อมคำอธิบายที่เป็นข้อความซึ่งมาจากเว็บ วิดีโอมีความหลากหลายและเต็มไปด้วยเนื้อหา
WebVid-10M ประกอบด้วย:
คู่คำบรรยายวิดีโอ 10.7 ล้านคู่ 52K ชั่วโมงวิดีโอทั้งหมด
หน้าแรก : https://m-bain.github.io/webvid-dataset/
รหัสที่มา :
tfds.datasets.webvid.Builder
รุ่น :
-
1.0.0
(ค่าเริ่มต้น): การเปิดตัวครั้งแรก
-
ขนาดการดาวน์โหลด :
Unknown size
ขนาดชุดข้อมูล :
Unknown size
คำแนะนำในการดาวน์โหลดด้วยตนเอง : ชุดข้อมูลนี้กำหนดให้คุณต้องดาวน์โหลดแหล่งข้อมูลด้วยตนเองลงใน
download_config.manual_dir
(ค่าเริ่มต้นเป็น~/tensorflow_datasets/downloads/manual/
):
ทำตามคำแนะนำการดาวน์โหลดใน https://m-bain.github.io/webvid-dataset/ เพื่อรับข้อมูล วางไฟล์ csv และไดเรกทอรีวิดีโอในmanual_dir/webvid
เพื่อให้ไฟล์ mp4 ถูกวางไว้ในmanual_dir/webvid/*/*_*/*.mp4
โดยทั่วไปไดเร็กทอรีแรกจะเป็นไดเร็กทอรีส่วนใดก็ได้ (สำหรับการดาวน์โหลดแบบชาร์ด) ไดเร็กทอรีที่สองคือไดเร็กทอรีเพจ (ตัวเลขสองตัวรอบๆ ขีดล่าง) ซึ่งภายในมีไฟล์ mp4 หนึ่งไฟล์หรือมากกว่า
แคชอัตโนมัติ ( เอกสาร ): ไม่รู้จัก
แยก :
แยก | ตัวอย่าง |
---|
- โครงสร้างคุณลักษณะ :
FeaturesDict({
'caption': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
'video': Video(Image(shape=(360, 640, 3), dtype=uint8)),
})
- เอกสารคุณสมบัติ :
คุณสมบัติ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
คุณสมบัติDict | ||||
คำอธิบายภาพ | ข้อความ | สตริง | ||
รหัส | ข้อความ | สตริง | ||
URL | ข้อความ | สตริง | ||
วิดีโอ | วิดีโอ (รูปภาพ) | (ไม่มี, 360, 640, 3) | uint8 |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):None
รูปภาพ ( tfds.show_examples ): ไม่รองรับ
ตัวอย่าง ( tfds.as_dataframe ): ไม่มี
การอ้างอิง :
@misc{bain2021frozen,
title={Frozen in Time: A Joint Video and Image Encoder for End-to-End Retrieval},
author={Max Bain and Arsha Nagrani and Gül Varol and Andrew Zisserman},
year={2021},
eprint={2104.00650},
archivePrefix={arXiv},
primaryClass={cs.CV}
}
, - คำอธิบาย :
WebVid เป็นชุดข้อมูลขนาดใหญ่ของวิดีโอขนาดสั้นพร้อมคำอธิบายที่เป็นข้อความซึ่งมาจากเว็บ วิดีโอมีความหลากหลายและเต็มไปด้วยเนื้อหา
WebVid-10M ประกอบด้วย:
คู่คำบรรยายวิดีโอ 10.7 ล้านคู่ 52K ชั่วโมงวิดีโอทั้งหมด
หน้าแรก : https://m-bain.github.io/webvid-dataset/
รหัสที่มา :
tfds.datasets.webvid.Builder
รุ่น :
-
1.0.0
(ค่าเริ่มต้น): การเปิดตัวครั้งแรก
-
ขนาดการดาวน์โหลด :
Unknown size
ขนาดชุดข้อมูล :
Unknown size
คำแนะนำในการดาวน์โหลดด้วยตนเอง : ชุดข้อมูลนี้กำหนดให้คุณต้องดาวน์โหลดแหล่งข้อมูลด้วยตนเองลงใน
download_config.manual_dir
(ค่าเริ่มต้นเป็น~/tensorflow_datasets/downloads/manual/
):
ทำตามคำแนะนำการดาวน์โหลดใน https://m-bain.github.io/webvid-dataset/ เพื่อรับข้อมูล วางไฟล์ csv และไดเรกทอรีวิดีโอในmanual_dir/webvid
เพื่อให้ไฟล์ mp4 ถูกวางไว้ในmanual_dir/webvid/*/*_*/*.mp4
โดยทั่วไปไดเร็กทอรีแรกจะเป็นไดเร็กทอรีส่วนใดก็ได้ (สำหรับการดาวน์โหลดแบบชาร์ด) ไดเร็กทอรีที่สองคือไดเร็กทอรีเพจ (ตัวเลขสองตัวรอบๆ ขีดล่าง) ซึ่งภายในมีไฟล์ mp4 หนึ่งไฟล์หรือมากกว่า
แคชอัตโนมัติ ( เอกสาร ): ไม่รู้จัก
แยก :
แยก | ตัวอย่าง |
---|
- โครงสร้างคุณลักษณะ :
FeaturesDict({
'caption': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
'video': Video(Image(shape=(360, 640, 3), dtype=uint8)),
})
- เอกสารคุณสมบัติ :
คุณสมบัติ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
คุณสมบัติDict | ||||
คำอธิบายภาพ | ข้อความ | สตริง | ||
รหัส | ข้อความ | สตริง | ||
URL | ข้อความ | สตริง | ||
วิดีโอ | วิดีโอ (รูปภาพ) | (ไม่มี, 360, 640, 3) | uint8 |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):None
รูปภาพ ( tfds.show_examples ): ไม่รองรับ
ตัวอย่าง ( tfds.as_dataframe ): ไม่มี
การอ้างอิง :
@misc{bain2021frozen,
title={Frozen in Time: A Joint Video and Image Encoder for End-to-End Retrieval},
author={Max Bain and Arsha Nagrani and Gül Varol and Andrew Zisserman},
year={2021},
eprint={2104.00650},
archivePrefix={arXiv},
primaryClass={cs.CV}
}