gtzan

  • Mô tả :

Tập dữ liệu bao gồm 1000 đoạn âm thanh mỗi đoạn dài 30 giây. Nó bao gồm 10 thể loại, mỗi thể loại được thể hiện bằng 100 bản nhạc. Các bài hát đều là tệp âm thanh 22050Hz Mono 16-bit ở định dạng .wav.

Các thể loại là:

  • blues
  • cổ điển
  • Quốc gia
  • sàn nhảy
  • Hiphop
  • nhạc jazz
  • kim khí
  • nhạc pop
  • reggae
  • đá

  • Trang chủ : http://marsyas.info/index.html

  • Mã nguồn : tfds.audio.gtzan.GTZAN

  • Các phiên bản :

    • 1.0.0 (mặc định): Không có ghi chú phát hành.
  • Kích thước tải xuống : 1.14 GiB

  • Kích thước tập dữ liệu : 3.71 GiB

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không

  • Tách :

Tách ra Các ví dụ
'train' 1.000
  • Các tính năng :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=tf.int64),
    'audio/filename': Text(shape=(), dtype=tf.string),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
})
  • Trích dẫn :
@misc{tzanetakis_essl_cook_2001,
author    = "Tzanetakis, George and Essl, Georg and Cook, Perry",
title     = "Automatic Musical Genre Classification Of Audio Signals",
url       = "http://ismir2001.ismir.net/pdf/tzanetakis.pdf",
publisher = "The International Society for Music Information Retrieval",
year      = "2001"
}