voxceleb

  • توضیحات :

مجموعه داده در مقیاس بزرگ برای شناسایی گوینده. این داده ها از بیش از 1251 سخنران با بیش از 150 هزار نمونه جمع آوری شده است. این نسخه شامل بخش صوتی مجموعه داده voxceleb1.1 است.

شکاف مثال ها
'test' 7,972
'train' 134000
'validation' 6670
  • ساختار ویژگی :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1252),
    'youtube_id': Text(shape=(), dtype=string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
سمعی سمعی (هیچ یک،) int64
برچسب ClassLabel int64
youtube_id متن رشته
  • نقل قول :
@InProceedings{Nagrani17,
    author       = "Nagrani, A. and Chung, J.~S. and Zisserman, A.",
    title        = "VoxCeleb: a large-scale speaker identification dataset",
    booktitle    = "INTERSPEECH",
    year         = "2017",
}