voxceleb

  • Açıklama :

Konuşmacı tanımlaması için büyük ölçekli bir veri kümesi. Bu veriler, toplamda 150.000'den fazla örnekle 1.251'den fazla konuşmacıdan toplanır. Bu sürüm, voxceleb1.1 veri kümesinin ses bölümünü içerir.

Bölmek örnekler
'test' 7.972
'train' 134.000
'validation' 6.670
  • Özellik yapısı :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1252),
    'youtube_id': Text(shape=(), dtype=string),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
ses Ses (Hiçbiri,) int64
etiket SınıfEtiketi int64
youtube_id Metin sicim
  • Alıntı :
@InProceedings{Nagrani17,
    author       = "Nagrani, A. and Chung, J.~S. and Zisserman, A.",
    title        = "VoxCeleb: a large-scale speaker identification dataset",
    booktitle    = "INTERSPEECH",
    year         = "2017",
}