ספרה_מדוברת

  • תיאור :

מערך שמע בחינם של ספרות מדוברות. תחשוב על MNIST לאודיו.

מערך נתונים פשוט של שמע/דיבור המורכב מהקלטות של ספרות מדוברות בקבצי WAV בתדר 8kHz. ההקלטות גזוזות כך שתהיה להן שקט כמעט מינימלי בהתחלה ובסוף.

5 רמקולים
2,500 הקלטות (50 מכל ספרה לכל רמקול)
הגיות באנגלית

הקבצים נקראים בפורמט הבא: {digitLabel} {speakerName} {index}.wav

לְפַצֵל דוגמאות
'train' 2,500
  • מבנה תכונה :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'audio/filename': Text(shape=(), dtype=string),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
שֶׁמַע שֶׁמַע (אף אחד,) int64
אודיו/שם קובץ טֶקסט חוּט
תווית ClassLabel int64
  • ציטוט :
@ONLINE {Free Spoken Digit Dataset,
    author = "Zohar Jackson",
    title  = "Spoken_Digit",
    year   = "2016",
    url    = "https://github.com/Jakobovski/free-spoken-digit-dataset"
}