Mfcc

מחלקה סופית ציבורית Mfcc

הופך ספקטרוגרמה לצורה שימושית לזיהוי דיבור.

Mel Frequency Cepstral Coefficients הם דרך לייצוג נתוני אודיו שהייתה יעילה כתכונת קלט ללמידת מכונה. הם נוצרים על ידי נטילת הספקטרום של ספקטרוגרמה ('cepstrum'), והשלכת חלק מהתדרים הגבוהים שפחות משמעותיים לאוזן האנושית. יש להם היסטוריה ארוכה בעולם זיהוי הדיבור, ו-https://en.wikipedia.org/wiki/Mel-frequency_cepstrum הוא משאב טוב למידע נוסף.

כיתות מקוננות

מעמד Mfcc.Options תכונות אופציונליות עבור Mfcc

קבועים

חוּט OP_NAME השם של המבצע הזה, כפי שידוע על ידי מנוע הליבה של TensorFlow

שיטות ציבוריות

פלט < TFloat32 >
asOutput ()
מחזירה את הידית הסמלית של הטנזור.
Mfcc סטטי
צור ( scope scope, Operand < TFloat32 > spectrogram, Operand < TInt32 > sampleRate, Options... options)
שיטת מפעל ליצירת מחלקה העוטפת פעולת Mfcc חדשה.
סטטי Mfcc.Options
dctCoefficientCount (Long dctCoefficientCount)
סטטי Mfcc.Options
filterbankChannelCount (Long filterbankChannelCount)
סטטי Mfcc.Options
lowerFrequencyLimit (צף lowerFrequencyLimit)
פלט < TFloat32 >
פלט ()
סטטי Mfcc.Options
upperFrequencyLimit (צף upperFrequencyLimit)

שיטות בירושה

קבועים

מחרוזת סופית סטטית ציבורית OP_NAME

השם של המבצע הזה, כפי שידוע על ידי מנוע הליבה של TensorFlow

ערך קבוע: "Mfcc"

שיטות ציבוריות

פלט ציבורי < TFloat32 > asOutput ()

מחזירה את הידית הסמלית של הטנזור.

כניסות לפעולות TensorFlow הן יציאות של פעולת TensorFlow אחרת. שיטה זו משמשת להשגת ידית סמלית המייצגת את חישוב הקלט.

יצירת Mfcc סטטית ציבורית ( scope scope, Operand < TFloat32 > spectrogram, Operand < TInt32 > sampleRate, Options... options)

שיטת מפעל ליצירת מחלקה העוטפת פעולת Mfcc חדשה.

פרמטרים
תְחוּם ההיקף הנוכחי
ספקטרוגרם מיוצר בדרך כלל על ידי ה- Spectrogram op, כאשר magnitude_squared מוגדר כ-true.
קצב דגימה כמה דגימות בשנייה השתמש בשמע המקור.
אפשרויות נושא ערכי תכונות אופציונליות
החזרות
  • מופע חדש של Mfcc

public static Mfcc.Options dctCoefficientCount (Long dctCoefficientCount)

פרמטרים
dctCoefficientCount כמה ערוצי פלט לייצר לכל פרוסת זמן.

ציבורי סטטי Mfcc.Options filterbankChannelCount (Long filterbankChannelCount)

פרמטרים
filterbankChannelCount רזולוציה של בנק מל בשימוש פנימי.

Mfcc סטטי ציבורי. אפשרויות lowerFrequencyLimit (צף lowerFrequencyLimit)

פרמטרים
LowFrequencyLimit התדר הנמוך ביותר לשימוש בעת חישוב הספקטרום.

פלט ציבורי < TFloat32 > פלט ()

ציבורי סטטי Mfcc.Options upperFrequencyLimit (Float upperFrequencyLimit)

פרמטרים
UpperFrequencyLimit התדירות הגבוהה ביותר לשימוש בעת חישוב הספקטרום.