gtzan

  • توضیحات :

مجموعه داده شامل 1000 آهنگ صوتی هر 30 ثانیه است. این شامل 10 ژانر است که هر کدام با 100 آهنگ نمایش داده می شوند. آهنگ ها همگی فایل های صوتی 16 بیتی مونو با فرکانس 22050 هرتز و با فرمت wav.

ژانرها عبارتند از:

شکاف مثال ها
'train' 1000
  • ساختار ویژگی :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'audio/filename': Text(shape=(), dtype=string),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
سمعی سمعی (هیچ یک،) int64
صدا/نام فایل متن رشته
برچسب ClassLabel int64
  • نقل قول :
@misc{tzanetakis_essl_cook_2001,
author    = "Tzanetakis, George and Essl, Georg and Cook, Perry",
title     = "Automatic Musical Genre Classification Of Audio Signals",
url       = "http://ismir2001.ismir.net/pdf/tzanetakis.pdf",
publisher = "The International Society for Music Information Retrieval",
year      = "2001"
}