نعم / لا

  • الوصف :

ستون تسجيلاً لشخص واحد يقول نعم أو لا بالعبرية ؛ كل تسجيل يتكون من ثماني كلمات.

تتمثل النقطة الرئيسية لمجموعة البيانات في توفير طريقة سهلة وسريعة لاختبار نصوص Kaldi مجانًا.

يحتوي أرشيف "wave_yesno.tar.gz" على 60 ملفًا بتنسيق wav ، تم أخذ عينات منها بتردد 8 كيلو هرتز. تم تسجيلها جميعًا بواسطة نفس المتحدث الذكر ، باللغة العبرية. في كل ملف يقول الفرد 8 كلمات ؛ كل كلمة هي إما العبرية لـ "نعم" أو "لا" ، لذا فإن كل ملف عبارة عن تسلسل عشوائي من 8 نعم أو لا. لا يوجد نسخ منفصل مقدم ؛ يتم ترميز التسلسل في اسم الملف ، مع 1 لـ "نعم" و 0 لـ "لا".

انشق، مزق أمثلة
'train' 60
  • هيكل الميزة :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'audio/filename': Text(shape=(), dtype=string),
    'label': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=2)),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
صوتي صوتي (لا أحد،) int64
الصوت / اسم الملف نص سلسلة
ضع الكلمة المناسبة تسلسل (ClassLabel) (لا أحد،) int64
  • الاقتباس :
@ONLINE {YesNo,
    author = "Created for the Kaldi Project",
    title  = "YesNo",
    url    = "http://www.openslr.org/1/"
}