- توضیحات :
مجموعه داده شامل 1000 آهنگ صوتی هر 30 ثانیه است. این شامل 10 ژانر است که هر کدام با 100 آهنگ نمایش داده می شوند. آهنگ ها همگی فایل های صوتی 16 بیتی مونو با فرکانس 22050 هرتز و با فرمت wav.
ژانرها عبارتند از:
- بلوز
- کلاسیک
- کشور
- دیسکو
- هیپ هاپ
- جاز
- فلز
- ترکیدن
- رگی
سنگ
اسناد اضافی : کاوش در کاغذها با کد
صفحه اصلی : http://marsyas.info/index.html
کد منبع :
tfds.audio.gtzan.GTZAN
نسخه ها :
-
1.0.0
(پیش فرض): بدون یادداشت انتشار.
-
حجم دانلود :
1.14 GiB
حجم مجموعه داده :
3.71 GiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1000 |
- ساختار ویژگی :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=int64),
'audio/filename': Text(shape=(), dtype=string),
'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
سمعی | سمعی | (هیچ یک،) | int64 | |
صدا/نام فایل | متن | رشته | ||
برچسب | ClassLabel | int64 |
کلیدهای نظارت شده (مشاهده
as_supervised
doc ):('audio', 'label')
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ):
- نقل قول :
@misc{tzanetakis_essl_cook_2001,
author = "Tzanetakis, George and Essl, Georg and Cook, Perry",
title = "Automatic Musical Genre Classification Of Audio Signals",
url = "http://ismir2001.ismir.net/pdf/tzanetakis.pdf",
publisher = "The International Society for Music Information Retrieval",
year = "2001"
}