- Mô tả :
Bộ dữ liệu bao gồm 1000 bản âm thanh, mỗi bản dài 30 giây. Nó chứa 10 thể loại, mỗi thể loại được thể hiện bằng 100 bản nhạc. Các bản nhạc đều là tệp âm thanh Mono 16-bit 22050Hz ở định dạng .wav.
Các thể loại là:
- nhạc blues
- cổ điển
- quốc gia
- vũ trường
- Hiphop
- nhạc jazz
- kim loại
- nhạc pop
- reggae
đá
Tài liệu bổ sung : Khám phá trên giấy tờ với mã
Trang chủ : http://marsyas.info/index.html
Mã nguồn :
tfds.audio.gtzan.GTZAN
Phiên bản :
-
1.0.0
(mặc định): Không có ghi chú phát hành.
-
Kích thước tải xuống :
1.14 GiB
Kích thước tập dữ liệu :
3.71 GiB
Tự động lưu vào bộ nhớ cache ( tài liệu ): Không
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 1.000 |
- Cấu trúc tính năng :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=int64),
'audio/filename': Text(shape=(), dtype=string),
'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
âm thanh | âm thanh | (Không có,) | int64 | |
âm thanh/tên tệp | Chữ | sợi dây | ||
nhãn mác | LớpNhãn | int64 |
Các khóa được giám sát (Xem
as_supervised
doc ):('audio', 'label')
Hình ( tfds.show_examples ): Không được hỗ trợ.
Ví dụ ( tfds.as_dataframe ):
- trích dẫn :
@misc{tzanetakis_essl_cook_2001,
author = "Tzanetakis, George and Essl, Georg and Cook, Perry",
title = "Automatic Musical Genre Classification Of Audio Signals",
url = "http://ismir2001.ismir.net/pdf/tzanetakis.pdf",
publisher = "The International Society for Music Information Retrieval",
year = "2001"
}