voxceleb

  • বর্ণনা :

স্পিকার সনাক্তকরণের জন্য একটি বড় আকারের ডেটাসেট। মোট 150k নমুনা সহ 1,251 টিরও বেশি স্পিকার থেকে এই ডেটা সংগ্রহ করা হয়েছে। এই রিলিজে voxceleb1.1 ডেটাসেটের অডিও অংশ রয়েছে।

  • অতিরিক্ত ডকুমেন্টেশন : কোড সহ কাগজপত্রে অন্বেষণ করুন

  • হোমপেজ : http://www.robots.ox.ac.uk/~vgg/data/voxceleb/vox1.html

  • সোর্স কোড : tfds.audio.Voxceleb

  • সংস্করণ :

    • 1.2.1 (ডিফল্ট): youtube_id ক্ষেত্র যোগ করুন
  • ডাউনলোড 4.68 MiB

  • ডেটাসেটের আকার : 107.98 GiB

  • ম্যানুয়াল ডাউনলোডের নির্দেশাবলী : এই ডেটাসেটের জন্য আপনাকে ডাউনলোড_config.manual_dir-এ ম্যানুয়ালি উৎস ডেটা download_config.manual_dir করতে হবে ( ~/tensorflow_datasets/downloads/manual/ ডিফল্ট):
    manual_dir-এ vox_dev_wav.zip ফাইল থাকা উচিত। এই ফাইলটি ডাউনলোড করার জন্য নির্দেশাবলী পাওয়া যায় http://www.robots.ox.ac.uk/~vgg/data/voxceleb/vox1.html এই ডেটাসেটের নিবন্ধন প্রয়োজন৷

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 7,972
'train' 134,000
'validation' ৬,৬৭০
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1252),
    'youtube_id': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
শ্রুতি শ্রুতি (কোনটিই নয়,) int64
লেবেল ক্লাসলেবেল int64
youtube_id পাঠ্য স্ট্রিং
  • উদ্ধৃতি :
@InProceedings{Nagrani17,
    author       = "Nagrani, A. and Chung, J.~S. and Zisserman, A.",
    title        = "VoxCeleb: a large-scale speaker identification dataset",
    booktitle    = "INTERSPEECH",
    year         = "2017",
}