voxceleb

  • Deskripsi :

Kumpulan data berskala besar untuk identifikasi pembicara. Data ini dikumpulkan dari lebih dari 1.251 pembicara, dengan total lebih dari 150 ribu sampel. Rilis ini berisi bagian audio dari kumpulan data voxceleb1.1.

Membelah Contoh
'test' 7.972
'train' 134.000
'validation' 6.670
  • Struktur fitur :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1252),
    'youtube_id': Text(shape=(), dtype=string),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Dtype Keterangan
fiturDict
audio Audio (Tidak ada,) int64
label LabelKelas int64
youtube_id Teks rangkaian
  • Kutipan :
@InProceedings{Nagrani17,
    author       = "Nagrani, A. and Chung, J.~S. and Zisserman, A.",
    title        = "VoxCeleb: a large-scale speaker identification dataset",
    booktitle    = "INTERSPEECH",
    year         = "2017",
}