- Deskripsi :
Kumpulan data berskala besar untuk identifikasi pembicara. Data ini dikumpulkan dari lebih dari 1.251 pembicara, dengan total lebih dari 150 ribu sampel. Rilis ini berisi bagian audio dari kumpulan data voxceleb1.1.
Dokumentasi Tambahan : Jelajahi di Makalah Dengan Kode
Beranda : http://www.robots.ox.ac.uk/~vgg/data/voxceleb/vox1.html
Kode sumber :
tfds.audio.VoxcelebVersi :
-
1.2.1(default): Tambahkan kolom youtube_id
-
Ukuran unduhan :
4.68 MiBUkuran dataset :
107.98 GiBInstruksi pengunduhan manual : Kumpulan data ini mengharuskan Anda mengunduh data sumber secara manual ke
download_config.manual_dir(default ke~/tensorflow_datasets/downloads/manual/):
manual_dir harus berisi file vox_dev_wav.zip. Petunjuk untuk mengunduh file ini dapat ditemukan di http://www.robots.ox.ac.uk/~vgg/data/voxceleb/vox1.html Kumpulan data ini memerlukan pendaftaran.Di-cache otomatis ( dokumentasi ): Tidak
Perpecahan :
| Membelah | Contoh |
|---|---|
'test' | 7.972 |
'train' | 134.000 |
'validation' | 6.670 |
- Struktur fitur :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=int64),
'label': ClassLabel(shape=(), dtype=int64, num_classes=1252),
'youtube_id': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| fiturDict | ||||
| audio | Audio | (Tidak ada,) | int64 | |
| label | LabelKelas | int64 | ||
| youtube_id | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):('audio', 'label')Gambar ( tfds.show_examples ): Tidak didukung.
Contoh ( tfds.as_dataframe ):
- Kutipan :
@InProceedings{Nagrani17,
author = "Nagrani, A. and Chung, J.~S. and Zisserman, A.",
title = "VoxCeleb: a large-scale speaker identification dataset",
booktitle = "INTERSPEECH",
year = "2017",
}