gtzan

الوصف :

تتكون مجموعة البيانات من 1000 مسار صوتي كل 30 ثانية. يحتوي على 10 أنواع ، يمثل كل منها 100 مسار. المسارات هي جميع ملفات الصوت أحادية 16 بت 22050 هرتز بتنسيق .wav.

الأنواع هي:

البلوز
كلاسيكي
بلد
ديسكو
هيب هوب
موسيقى الجاز
فلز
البوب
الريغي
صخر
وثائق إضافية : استكشف في الأوراق باستخدام الرمز
الصفحة الرئيسية : http://marsyas.info/index.html
كود المصدر : tfds.audio.gtzan.GTZAN
إصدارات :
- 1.0.0 (افتراضي): لا توجد ملاحظات حول الإصدار.
حجم التحميل : 1.14 GiB
حجم مجموعة البيانات : 3.71 GiB
التخزين المؤقت التلقائي ( التوثيق ): لا
الانقسامات :

انشق، مزق	أمثلة
`'train'`	1،000

هيكل الميزة :

FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'audio/filename': Text(shape=(), dtype=string),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})

وثائق الميزة :

ميزة	فصل	شكل	نوع
	الميزات
صوتي	صوتي	(لا أحد،)	int64
الصوت / اسم الملف	نص		سلسلة
ضع الكلمة المناسبة	ClassLabel		int64

المفاتيح الخاضعة للإشراف (راجع المستند as_supervised ): ('audio', 'label')
الشكل ( tfds.show_examples ): غير مدعوم.
أمثلة ( tfds.as_dataframe ):

الاقتباس :

@misc{tzanetakis_essl_cook_2001,
author    = "Tzanetakis, George and Essl, Georg and Cook, Perry",
title     = "Automatic Musical Genre Classification Of Audio Signals",
url       = "http://ismir2001.ismir.net/pdf/tzanetakis.pdf",
publisher = "The International Society for Music Information Retrieval",
year      = "2001"
}

gtzan تنظيم صفحاتك في مجموعات يمكنك حفظ المحتوى وتصنيفه حسب إعداداتك المفضّلة.

gtzan