- Deskripsi :
Kumpulan data berskala besar untuk identifikasi pembicara. Data ini dikumpulkan dari lebih dari 1.251 pembicara, dengan total lebih dari 150 ribu sampel. Rilis ini berisi bagian audio dari kumpulan data voxceleb1.1.
Dokumentasi Tambahan : Jelajahi di Makalah Dengan Kode
Beranda : http://www.robots.ox.ac.uk/~vgg/data/voxceleb/vox1.html
Kode sumber :
tfds.audio.Voxceleb
Versi :
-
1.2.1
(default): Tambahkan kolom youtube_id
-
Ukuran unduhan :
4.68 MiB
Ukuran dataset :
107.98 GiB
Instruksi pengunduhan manual : Kumpulan data ini mengharuskan Anda mengunduh data sumber secara manual ke
download_config.manual_dir
(default ke~/tensorflow_datasets/downloads/manual/
):
manual_dir harus berisi file vox_dev_wav.zip. Petunjuk untuk mengunduh file ini dapat ditemukan di http://www.robots.ox.ac.uk/~vgg/data/voxceleb/vox1.html Kumpulan data ini memerlukan pendaftaran.Di-cache otomatis ( dokumentasi ): Tidak
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 7.972 |
'train' | 134.000 |
'validation' | 6.670 |
- Struktur fitur :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=int64),
'label': ClassLabel(shape=(), dtype=int64, num_classes=1252),
'youtube_id': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
fiturDict | ||||
audio | Audio | (Tidak ada,) | int64 | |
label | LabelKelas | int64 | ||
youtube_id | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_supervised
doc ):('audio', 'label')
Gambar ( tfds.show_examples ): Tidak didukung.
Contoh ( tfds.as_dataframe ):
- Kutipan :
@InProceedings{Nagrani17,
author = "Nagrani, A. and Chung, J.~S. and Zisserman, A.",
title = "VoxCeleb: a large-scale speaker identification dataset",
booktitle = "INTERSPEECH",
year = "2017",
}