gtzan

Deskripsi :

Dataset terdiri dari 1000 trek audio yang masing-masing berdurasi 30 detik. Ini berisi 10 genre, masing-masing diwakili oleh 100 lagu. Treknya adalah semua file audio Mono 16-bit 22050Hz dalam format .wav.

Genre tersebut adalah:

biru
klasik
negara
disko
hiphop
jazz
logam
pop
reggae
batu
Dokumentasi Tambahan : Jelajahi di Makalah Dengan Kode
Beranda : http://marsyas.info/index.html
Kode sumber : tfds.audio.gtzan.GTZAN
Versi :
- 1.0.0 (default): Tidak ada catatan rilis.
Ukuran unduhan : 1.14 GiB
Ukuran dataset : 3.71 GiB
Di-cache otomatis ( dokumentasi ): Tidak
Perpecahan :

Membelah	Contoh
`'train'`	1.000

Struktur fitur :

FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'audio/filename': Text(shape=(), dtype=string),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})

Dokumentasi fitur :

Fitur	Kelas	Membentuk	Dtype
	fiturDict
audio	Audio	(Tidak ada,)	int64
audio/nama file	Teks		rangkaian
label	LabelKelas		int64

Kunci yang diawasi (Lihat as_supervised doc ): ('audio', 'label')
Gambar ( tfds.show_examples ): Tidak didukung.
Contoh ( tfds.as_dataframe ):

Kutipan :

@misc{tzanetakis_essl_cook_2001,
author    = "Tzanetakis, George and Essl, Georg and Cook, Perry",
title     = "Automatic Musical Genre Classification Of Audio Signals",
url       = "http://ismir2001.ismir.net/pdf/tzanetakis.pdf",
publisher = "The International Society for Music Information Retrieval",
year      = "2001"
}

gtzan Tetap teratur dengan koleksi Simpan dan kategorikan konten berdasarkan preferensi Anda.

gtzan