- توضیحات :
مجموعه داده برای اهداف تمایز موسیقی / گفتار جمع آوری شد. مجموعه داده شامل 120 آهنگ است که هر کدام 30 ثانیه طول می کشد. هر کلاس (موسیقی/سخنرانی) 60 نمونه دارد. آهنگ ها همگی فایل های صوتی 16 بیتی مونو با فرکانس 22050 هرتز و با فرمت wav.
اسناد اضافی : کاوش در کاغذها با کد
صفحه اصلی : http://marsyas.info/index.html
نسخه ها :
-
1.0.0
(پیش فرض): بدون یادداشت انتشار.
-
حجم دانلود :
283.29 MiB
حجم مجموعه داده :
424.64 MiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 128 |
- ساختار ویژگی :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=int64),
'audio/filename': Text(shape=(), dtype=string),
'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
سمعی | سمعی | (هیچ یک،) | int64 | |
صدا/نام فایل | متن | رشته | ||
برچسب | ClassLabel | int64 |
کلیدهای نظارت شده (مشاهده
as_supervised
doc ):('audio', 'label')
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ):
- نقل قول :
@ONLINE {Music Speech,
author = "Tzanetakis, George",
title = "GTZAN Music/Speech Collection",
year = "1999",
url = "http://marsyas.info/index.html"
}