- תיאור :
שישים הקלטות של אדם אחד שאומר כן או לא בעברית; כל הקלטה באורך שמונה מילים.
הנקודה העיקרית של מערך הנתונים היא לספק דרך קלה ומהירה לבדוק את הסקריפטים של Kaldi בחינם.
הארכיון "waves_yesno.tar.gz" מכיל 60 קבצי WAV, שנדגמו במהירות של 8 קילו-הרץ. כולם הוקלטו על ידי אותו דובר זכר, בעברית. בכל קובץ, הפרט אומר 8 מילים; כל מילה היא בעברית של "כן" או "לא", כך שכל קובץ הוא רצף אקראי של 8 כן-ים או לא. לא מסופק תמלול נפרד; הרצף מקודד בשם הקובץ, עם 1 עבור כן ו-0 עבור לא.
תיעוד נוסף : חקור על ניירות עם קוד
דף הבית : https://www.openslr.org/1/
קוד מקור :
tfds.audio.yesno.YesNo
גרסאות :
-
1.0.0
(ברירת מחדל): אין הערות שחרור.
-
גודל הורדה :
4.49 MiB
גודל מערך נתונים :
16.27 MiB
שמור אוטומטי במטמון ( תיעוד ): כן
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'train' | 60 |
- מבנה תכונה :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=int64),
'audio/filename': Text(shape=(), dtype=string),
'label': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=2)),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
FeaturesDict | ||||
שֶׁמַע | שֶׁמַע | (אף אחד,) | int64 | |
אודיו/שם קובץ | טֶקסט | חוּט | ||
תווית | Sequence (ClassLabel) | (אף אחד,) | int64 |
מפתחות בפיקוח (ראה
as_supervised
doc ):('audio', 'label')
איור ( tfds.show_examples ): לא נתמך.
דוגמאות ( tfds.as_dataframe ):
- ציטוט :
@ONLINE {YesNo,
author = "Created for the Kaldi Project",
title = "YesNo",
url = "http://www.openslr.org/1/"
}