gtzan

توضیحات :

مجموعه داده شامل 1000 آهنگ صوتی هر 30 ثانیه است. این شامل 10 ژانر است که هر کدام با 100 آهنگ نمایش داده می شوند. آهنگ ها همگی فایل های صوتی 16 بیتی مونو با فرکانس 22050 هرتز و با فرمت wav.

ژانرها عبارتند از:

بلوز
کلاسیک
کشور
دیسکو
هیپ هاپ
جاز
فلز
ترکیدن
رگی
سنگ
اسناد اضافی : کاوش در کاغذها با کد
صفحه اصلی : http://marsyas.info/index.html
کد منبع : tfds.audio.gtzan.GTZAN
نسخه ها :
- 1.0.0 (پیش فرض): بدون یادداشت انتشار.
حجم دانلود : 1.14 GiB
حجم مجموعه داده : 3.71 GiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :

شکاف	مثال ها
`'train'`	1000

ساختار ویژگی :

FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'audio/filename': Text(shape=(), dtype=string),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})

مستندات ویژگی :

ویژگی	کلاس	شکل	نوع D
	FeaturesDict
سمعی	سمعی	(هیچ یک،)	int64
صدا/نام فایل	متن		رشته
برچسب	ClassLabel		int64

کلیدهای نظارت شده (مشاهده as_supervised doc ): ('audio', 'label')
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثال‌ها ( tfds.as_dataframe ):

نقل قول :

@misc{tzanetakis_essl_cook_2001,
author    = "Tzanetakis, George and Essl, Georg and Cook, Perry",
title     = "Automatic Musical Genre Classification Of Audio Signals",
url       = "http://ismir2001.ismir.net/pdf/tzanetakis.pdf",
publisher = "The International Society for Music Information Retrieval",
year      = "2001"
}

gtzan با مجموعه‌ها، منظم بمانید ذخیره و طبقه‌بندی محتوا براساس اولویت‌های شما.

gtzan