- توضیحات :
شصت ضبط شده از یک فرد که به زبان عبری بله یا خیر می گوید. هر ضبط هشت کلمه است.
نکته اصلی مجموعه داده ارائه یک راه آسان و سریع برای آزمایش رایگان اسکریپت های Kaldi است.
آرشیو "waves_yesno.tar.gz" حاوی 60 فایل wav. است که با فرکانس 8 کیلوهرتز نمونه برداری شده است. همه توسط یک گوینده مرد به زبان عبری ضبط شده است. در هر فایل، فرد 8 کلمه می گوید. هر کلمه یا عبری برای "بله" یا "نه" است، بنابراین هر فایل یک دنباله تصادفی از 8 بله یا خیر است. هیچ رونویسی جداگانه ای ارائه نشده است. دنباله در نام فایل با 1 برای بله و 0 برای خیر کدگذاری می شود.
اسناد اضافی : کاوش در کاغذها با کد
صفحه اصلی : https://www.openslr.org/1/
کد منبع :
tfds.audio.yesno.YesNo
نسخه ها :
-
1.0.0
(پیش فرض): بدون یادداشت انتشار.
-
حجم دانلود :
4.49 MiB
حجم مجموعه داده :
16.27 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 60 |
- ساختار ویژگی :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=int64),
'audio/filename': Text(shape=(), dtype=string),
'label': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=2)),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
سمعی | سمعی | (هیچ یک،) | int64 | |
صدا/نام فایل | متن | رشته | ||
برچسب | دنباله (ClassLabel) | (هیچ یک،) | int64 |
کلیدهای نظارت شده (مشاهده
as_supervised
doc ):('audio', 'label')
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ):
- نقل قول :
@ONLINE {YesNo,
author = "Created for the Kaldi Project",
title = "YesNo",
url = "http://www.openslr.org/1/"
}