gtzan

Mô tả :

Bộ dữ liệu bao gồm 1000 bản âm thanh, mỗi bản dài 30 giây. Nó chứa 10 thể loại, mỗi thể loại được thể hiện bằng 100 bản nhạc. Các bản nhạc đều là tệp âm thanh Mono 16-bit 22050Hz ở định dạng .wav.

Các thể loại là:

nhạc blues
cổ điển
quốc gia
vũ trường
Hiphop
nhạc jazz
kim loại
nhạc pop
reggae
đá
Tài liệu bổ sung : Khám phá trên giấy tờ với mã
Trang chủ : http://marsyas.info/index.html
Mã nguồn : tfds.audio.gtzan.GTZAN
Phiên bản :
- 1.0.0 (mặc định): Không có ghi chú phát hành.
Kích thước tải xuống : 1.14 GiB
Kích thước tập dữ liệu : 3.71 GiB
Tự động lưu vào bộ nhớ cache ( tài liệu ): Không
Chia tách :

Tách ra	ví dụ
`'train'`	1.000

Cấu trúc tính năng :

FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'audio/filename': Text(shape=(), dtype=string),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})

Tài liệu tính năng :

Tính năng	Lớp	Hình dạng	Dtype
	Tính năngDict
âm thanh	âm thanh	(Không có,)	int64
âm thanh/tên tệp	Chữ		sợi dây
nhãn mác	LớpNhãn		int64

Các khóa được giám sát (Xem as_supervised doc ): ('audio', 'label')
Hình ( tfds.show_examples ): Không được hỗ trợ.
Ví dụ ( tfds.as_dataframe ):

trích dẫn :

@misc{tzanetakis_essl_cook_2001,
author    = "Tzanetakis, George and Essl, Georg and Cook, Perry",
title     = "Automatic Musical Genre Classification Of Audio Signals",
url       = "http://ismir2001.ismir.net/pdf/tzanetakis.pdf",
publisher = "The International Society for Music Information Retrieval",
year      = "2001"
}

gtzan Sử dụng bộ sưu tập để sắp xếp ngăn nắp các trang Lưu và phân loại nội dung dựa trên lựa chọn ưu tiên của bạn.

gtzan