voxceleb

Deskripsi :

Kumpulan data berskala besar untuk identifikasi pembicara. Data ini dikumpulkan dari lebih dari 1.251 pembicara, dengan total lebih dari 150 ribu sampel. Rilis ini berisi bagian audio dari kumpulan data voxceleb1.1.

Dokumentasi Tambahan : Jelajahi di Makalah Dengan Kode
Beranda : http://www.robots.ox.ac.uk/~vgg/data/voxceleb/vox1.html
Kode sumber : tfds.audio.Voxceleb
Versi :
- 1.2.1 (default): Tambahkan kolom youtube_id
Ukuran unduhan : 4.68 MiB
Ukuran dataset : 107.98 GiB
Instruksi pengunduhan manual : Kumpulan data ini mengharuskan Anda mengunduh data sumber secara manual ke download_config.manual_dir (default ke ~/tensorflow_datasets/downloads/manual/ ):
manual_dir harus berisi file vox_dev_wav.zip. Petunjuk untuk mengunduh file ini dapat ditemukan di http://www.robots.ox.ac.uk/~vgg/data/voxceleb/vox1.html Kumpulan data ini memerlukan pendaftaran.
Di-cache otomatis ( dokumentasi ): Tidak
Perpecahan :

Membelah	Contoh
`'test'`	7.972
`'train'`	134.000
`'validation'`	6.670

Struktur fitur :

FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1252),
    'youtube_id': Text(shape=(), dtype=string),
})

Dokumentasi fitur :

Fitur	Kelas	Membentuk	Dtype
	fiturDict
audio	Audio	(Tidak ada,)	int64
label	LabelKelas		int64
youtube_id	Teks		rangkaian

Kunci yang diawasi (Lihat as_supervised doc ): ('audio', 'label')
Gambar ( tfds.show_examples ): Tidak didukung.
Contoh ( tfds.as_dataframe ):

Kutipan :

@InProceedings{Nagrani17,
    author       = "Nagrani, A. and Chung, J.~S. and Zisserman, A.",
    title        = "VoxCeleb: a large-scale speaker identification dataset",
    booktitle    = "INTERSPEECH",
    year         = "2017",
}

voxceleb Tetap teratur dengan koleksi Simpan dan kategorikan konten berdasarkan preferensi Anda.

voxceleb