- Deskripsi :
Dataset terdiri dari 1000 trek audio yang masing-masing berdurasi 30 detik. Ini berisi 10 genre, masing-masing diwakili oleh 100 lagu. Treknya adalah semua file audio Mono 16-bit 22050Hz dalam format .wav.
Genre tersebut adalah:
- biru
- klasik
- negara
- disko
- hiphop
- jazz
- logam
- pop
- reggae
batu
Dokumentasi Tambahan : Jelajahi di Makalah Dengan Kode
Beranda : http://marsyas.info/index.html
Kode sumber :
tfds.audio.gtzan.GTZAN
Versi :
-
1.0.0
(default): Tidak ada catatan rilis.
-
Ukuran unduhan :
1.14 GiB
Ukuran dataset :
3.71 GiB
Di-cache otomatis ( dokumentasi ): Tidak
Perpecahan :
Membelah | Contoh |
---|---|
'train' | 1.000 |
- Struktur fitur :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=int64),
'audio/filename': Text(shape=(), dtype=string),
'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
fiturDict | ||||
audio | Audio | (Tidak ada,) | int64 | |
audio/nama file | Teks | rangkaian | ||
label | LabelKelas | int64 |
Kunci yang diawasi (Lihat
as_supervised
doc ):('audio', 'label')
Gambar ( tfds.show_examples ): Tidak didukung.
Contoh ( tfds.as_dataframe ):
- Kutipan :
@misc{tzanetakis_essl_cook_2001,
author = "Tzanetakis, George and Essl, Georg and Cook, Perry",
title = "Automatic Musical Genre Classification Of Audio Signals",
url = "http://ismir2001.ismir.net/pdf/tzanetakis.pdf",
publisher = "The International Society for Music Information Retrieval",
year = "2001"
}