gtzan

  • الوصف :

تتكون مجموعة البيانات من 1000 مسار صوتي كل 30 ثانية. يحتوي على 10 أنواع ، يمثل كل منها 100 مسار. المسارات هي جميع ملفات الصوت أحادية 16 بت 22050 هرتز بتنسيق .wav.

الأنواع هي:

انشق، مزق أمثلة
'train' 1،000
  • هيكل الميزة :
FeaturesDict({
   
'audio': Audio(shape=(None,), dtype=int64),
   
'audio/filename': Text(shape=(), dtype=string),
   
'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
صوتي صوتي (لا أحد،) int64
الصوت / اسم الملف نص سلسلة
ضع الكلمة المناسبة ClassLabel int64
  • الاقتباس :
@misc{tzanetakis_essl_cook_2001,
author    
= "Tzanetakis, George and Essl, Georg and Cook, Perry",
title    
= "Automatic Musical Genre Classification Of Audio Signals",
url      
= "http://ismir2001.ismir.net/pdf/tzanetakis.pdf",
publisher
= "The International Society for Music Information Retrieval",
year      
= "2001"
}