הופך ספקטרוגרמה לצורה שימושית לזיהוי דיבור.
Mel Frequency Cepstral Coefficients הם דרך לייצוג נתוני אודיו שהייתה יעילה כתכונת קלט ללמידת מכונה. הם נוצרים על ידי נטילת הספקטרום של ספקטרוגרמה ('cepstrum'), והשלכת חלק מהתדרים הגבוהים שפחות משמעותיים לאוזן האנושית. יש להם היסטוריה ארוכה בעולם זיהוי הדיבור, ו-https://en.wikipedia.org/wiki/Mel-frequency_cepstrum הוא משאב טוב למידע נוסף.
כיתות מקוננות
מעמד | Mfcc.Options | תכונות אופציונליות עבור Mfcc |
קבועים
חוּט | OP_NAME | השם של המבצע הזה, כפי שידוע על ידי מנוע הליבה של TensorFlow |
שיטות ציבוריות
פלט < TFloat32 > | asOutput () מחזירה את הידית הסמלית של הטנזור. |
Mfcc סטטי | |
סטטי Mfcc.Options | dctCoefficientCount (Long dctCoefficientCount) |
סטטי Mfcc.Options | filterbankChannelCount (Long filterbankChannelCount) |
סטטי Mfcc.Options | lowerFrequencyLimit (צף lowerFrequencyLimit) |
פלט < TFloat32 > | פלט () |
סטטי Mfcc.Options | upperFrequencyLimit (צף upperFrequencyLimit) |
שיטות בירושה
קבועים
מחרוזת סופית סטטית ציבורית OP_NAME
השם של המבצע הזה, כפי שידוע על ידי מנוע הליבה של TensorFlow
שיטות ציבוריות
פלט ציבורי < TFloat32 > asOutput ()
מחזירה את הידית הסמלית של הטנזור.
כניסות לפעולות TensorFlow הן יציאות של פעולת TensorFlow אחרת. שיטה זו משמשת להשגת ידית סמלית המייצגת את חישוב הקלט.
יצירת Mfcc סטטית ציבורית ( scope scope, Operand < TFloat32 > spectrogram, Operand < TInt32 > sampleRate, Options... options)
שיטת מפעל ליצירת מחלקה העוטפת פעולת Mfcc חדשה.
פרמטרים
תְחוּם | ההיקף הנוכחי |
---|---|
ספקטרוגרם | מיוצר בדרך כלל על ידי ה- Spectrogram op, כאשר magnitude_squared מוגדר כ-true. |
קצב דגימה | כמה דגימות בשנייה השתמש בשמע המקור. |
אפשרויות | נושא ערכי תכונות אופציונליות |
החזרות
- מופע חדש של Mfcc
public static Mfcc.Options dctCoefficientCount (Long dctCoefficientCount)
פרמטרים
dctCoefficientCount | כמה ערוצי פלט לייצר לכל פרוסת זמן. |
---|
ציבורי סטטי Mfcc.Options filterbankChannelCount (Long filterbankChannelCount)
פרמטרים
filterbankChannelCount | רזולוציה של בנק מל בשימוש פנימי. |
---|
Mfcc סטטי ציבורי. אפשרויות lowerFrequencyLimit (צף lowerFrequencyLimit)
פרמטרים
LowFrequencyLimit | התדר הנמוך ביותר לשימוש בעת חישוב הספקטרום. |
---|
ציבורי סטטי Mfcc.Options upperFrequencyLimit (Float upperFrequencyLimit)
פרמטרים
UpperFrequencyLimit | התדירות הגבוהה ביותר לשימוש בעת חישוב הספקטרום. |
---|