- Mô tả :
Tập dữ liệu bao gồm 1000 đoạn âm thanh mỗi đoạn dài 30 giây. Nó bao gồm 10 thể loại, mỗi thể loại được thể hiện bằng 100 bản nhạc. Các bài hát đều là tệp âm thanh 22050Hz Mono 16-bit ở định dạng .wav.
Các thể loại là:
- blues
- cổ điển
- Quốc gia
- sàn nhảy
- Hiphop
- nhạc jazz
- kim khí
- nhạc pop
- reggae
đá
Trang chủ : http://marsyas.info/index.html
Mã nguồn :
tfds.audio.gtzan.GTZAN
Các phiên bản :
-
1.0.0
(mặc định): Không có ghi chú phát hành.
-
Kích thước tải xuống :
1.14 GiB
Kích thước tập dữ liệu :
3.71 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Tách :
Tách ra | Các ví dụ |
---|---|
'train' | 1.000 |
- Các tính năng :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=tf.int64),
'audio/filename': Text(shape=(), dtype=tf.string),
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
})
Các khóa được giám sát (Xem
as_supervised
doc ):('audio', 'label')
Hình ( tfds.show_examples ): Không được hỗ trợ.
Ví dụ ( tfds.as_dataframe ):
- Trích dẫn :
@misc{tzanetakis_essl_cook_2001,
author = "Tzanetakis, George and Essl, Georg and Cook, Perry",
title = "Automatic Musical Genre Classification Of Audio Signals",
url = "http://ismir2001.ismir.net/pdf/tzanetakis.pdf",
publisher = "The International Society for Music Information Retrieval",
year = "2001"
}