ספרה_מדוברת

תיאור :

מערך שמע בחינם של ספרות מדוברות. תחשוב על MNIST לאודיו.

מערך נתונים פשוט של שמע/דיבור המורכב מהקלטות של ספרות מדוברות בקבצי WAV בתדר 8kHz. ההקלטות גזוזות כך שתהיה להן שקט כמעט מינימלי בהתחלה ובסוף.

5 רמקולים
2,500 הקלטות (50 מכל ספרה לכל רמקול)
הגיות באנגלית

הקבצים נקראים בפורמט הבא: {digitLabel} {speakerName} {index}.wav

תיעוד נוסף : חקור על ניירות עם קוד
דף הבית : https://github.com/Jakobovski/free-spoken-digit-dataset
קוד מקור : tfds.datasets.spoken_digit.Builder
גרסאות :
- 1.0.9 (ברירת מחדל): אין הערות שחרור.
גודל הורדה : 11.42 MiB
גודל מערך נתונים : 45.68 MiB
שמור אוטומטי במטמון ( תיעוד ): כן
פיצולים :

לְפַצֵל	דוגמאות
`'train'`	2,500

מבנה תכונה :

FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'audio/filename': Text(shape=(), dtype=string),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})

תיעוד תכונה :

תכונה	מעמד	צוּרָה	Dtype
	FeaturesDict
שֶׁמַע	שֶׁמַע	(אף אחד,)	int64
אודיו/שם קובץ	טֶקסט		חוּט
תווית	ClassLabel		int64

מפתחות בפיקוח (ראה as_supervised doc ): ('audio', 'label')
איור ( tfds.show_examples ): לא נתמך.
דוגמאות ( tfds.as_dataframe ):

ציטוט :

@ONLINE {Free Spoken Digit Dataset,
    author = "Zohar Jackson",
    title  = "Spoken_Digit",
    year   = "2016",
    url    = "https://github.com/Jakobovski/free-spoken-digit-dataset"
}

ספרה_מדוברת קל לארגן דפים בעזרת אוספים אפשר לשמור ולסווג תוכן על סמך ההעדפות שלך.

ספרה_מדוברת