gtzan_music_speech

توضیحات :

مجموعه داده برای اهداف تمایز موسیقی / گفتار جمع آوری شد. مجموعه داده شامل 120 آهنگ است که هر کدام 30 ثانیه طول می کشد. هر کلاس (موسیقی/سخنرانی) 60 نمونه دارد. آهنگ ها همگی فایل های صوتی 16 بیتی مونو با فرکانس 22050 هرتز و با فرمت wav.

اسناد اضافی : کاوش در کاغذها با کد
صفحه اصلی : http://marsyas.info/index.html
کد منبع : tfds.audio.gtzan_music_speech.GTZANMusicSpeech
نسخه ها :
- 1.0.0 (پیش فرض): بدون یادداشت انتشار.
حجم دانلود : 283.29 MiB
حجم مجموعه داده : 424.64 MiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :

شکاف	مثال ها
`'train'`	128

ساختار ویژگی :

FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'audio/filename': Text(shape=(), dtype=string),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
})

مستندات ویژگی :

ویژگی	کلاس	شکل	نوع D
	FeaturesDict
سمعی	سمعی	(هیچ یک،)	int64
صدا/نام فایل	متن		رشته
برچسب	ClassLabel		int64

کلیدهای نظارت شده (مشاهده as_supervised doc ): ('audio', 'label')
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثال‌ها ( tfds.as_dataframe ):

نقل قول :

@ONLINE {Music Speech,
    author = "Tzanetakis, George",
    title  = "GTZAN Music/Speech Collection",
    year   = "1999",
    url    = "http://marsyas.info/index.html"
}

gtzan_music_speech با مجموعه‌ها، منظم بمانید ذخیره و طبقه‌بندی محتوا براساس اولویت‌های شما.

gtzan_music_speech