Mfcc

מחלקה סופית ציבורית Mfcc

הופך ספקטרוגרמה לצורה שימושית לזיהוי דיבור.

Mel Frequency Cepstral Coefficients הם דרך לייצוג נתוני אודיו שהייתה יעילה כתכונת קלט ללמידת מכונה. הם נוצרים על ידי נטילת הספקטרום של ספקטרוגרמה ('cepstrum'), והשלכת חלק מהתדרים הגבוהים שפחות משמעותיים לאוזן האנושית. יש להם היסטוריה ארוכה בעולם זיהוי הדיבור, ו-https://en.wikipedia.org/wiki/Mel-frequency_cepstrum הוא משאב טוב למידע נוסף.

כיתות מקוננות

מעמד Mfcc.Options תכונות אופציונליות עבור Mfcc

קבועים

חוּט OP_NAME השם של המבצע הזה, כפי שידוע על ידי מנוע הליבה של TensorFlow

שיטות ציבוריות

פלט < TFloat32 >
asOutput ()
מחזירה את הידית הסמלית של הטנזור.
Mfcc סטטי
צור ( scope scope, Operand < TFloat32 > spectrogram, Operand < TInt32 > sampleRate, Options... options)
שיטת מפעל ליצירת מחלקה העוטפת פעולת Mfcc חדשה.
סטטי Mfcc.Options
dctCoefficientCount (Long dctCoefficientCount)
סטטי Mfcc.Options
filterbankChannelCount (Long filterbankChannelCount)
סטטי Mfcc.Options
lowerFrequencyLimit (צף lowerFrequencyLimit)
פלט < TFloat32 >
פלט ()
סטטי Mfcc.Options
upperFrequencyLimit (צף upperFrequencyLimit)

שיטות בירושה

org.tensorflow.op.RawOp
בוליאנית סופית
שווה (Object obj)
int סופי
מבצע
אופ ()
החזר יחידת חישוב זו Operation אחת.
מחרוזת סופית
בוליאני
שווה (Object arg0)
שיעור אחרון<?>
getClass ()
int
hashcode ()
ריק סופי
להודיע ​​()
ריק סופי
הודע הכל ()
חוּט
toString ()
ריק סופי
המתן (ארג0 ארוך, int arg1)
ריק סופי
חכה (ארג0 ארוך)
ריק סופי
חכה ()
org.tensorflow.op.Op
אבסטרקט ExecutionEnvironment
env ()
החזר את סביבת הביצוע שבה נוצר האופציה הזו.
מבצע מופשט
אופ ()
החזר יחידת חישוב זו Operation אחת.
org.tensorflow.Operand
פלט מופשט < TFloat32 >
asOutput ()
מחזירה את הידית הסמלית של הטנזור.
תקציר TFloat32
asTensor ()
מחזיר את הטנזור באופרנד זה.
צורה מופשטת
צורה ()
מחזירה את הצורה (הידועה אולי בחלקה) של הטנזור שאליו מתייחס Output של אופרנד זה.
תקציר Class< TFloat32 >
סוג ()
מחזירה את סוג הטנזור של אופרנד זה
org.tensorflow.ndarray.Shaped
מופשט int
צורה מופשטת
מופשט ארוך
גודל ()
מחשב ומחזיר את הגודל הכולל של מיכל זה, במספר ערכים.

קבועים

מחרוזת סופית סטטית ציבורית OP_NAME

השם של המבצע הזה, כפי שידוע על ידי מנוע הליבה של TensorFlow

ערך קבוע: "Mfcc"

שיטות ציבוריות

פלט ציבורי < TFloat32 > asOutput ()

מחזירה את הידית הסמלית של הטנזור.

כניסות לפעולות TensorFlow הן יציאות של פעולת TensorFlow אחרת. שיטה זו משמשת להשגת ידית סמלית המייצגת את חישוב הקלט.

יצירת Mfcc סטטית ציבורית ( scope scope, Operand < TFloat32 > spectrogram, Operand < TInt32 > sampleRate, Options... options)

שיטת מפעל ליצירת מחלקה העוטפת פעולת Mfcc חדשה.

פרמטרים
תְחוּם ההיקף הנוכחי
ספקטרוגרם מיוצר בדרך כלל על ידי ה- Spectrogram op, כאשר magnitude_squared מוגדר כ-true.
קצב דגימה כמה דגימות בשנייה השתמש בשמע המקור.
אפשרויות נושא ערכי תכונות אופציונליות
החזרות
  • מופע חדש של Mfcc

public static Mfcc.Options dctCoefficientCount (Long dctCoefficientCount)

פרמטרים
dctCoefficientCount כמה ערוצי פלט לייצר לכל פרוסת זמן.

ציבורי סטטי Mfcc.Options filterbankChannelCount (Long filterbankChannelCount)

פרמטרים
filterbankChannelCount רזולוציה של בנק מל בשימוש פנימי.

Mfcc סטטי ציבורי. אפשרויות lowerFrequencyLimit (צף lowerFrequencyLimit)

פרמטרים
LowFrequencyLimit התדר הנמוך ביותר לשימוש בעת חישוב הספקטרום.

פלט ציבורי < TFloat32 > פלט ()

ציבורי סטטי Mfcc.Options upperFrequencyLimit (Float upperFrequencyLimit)

פרמטרים
UpperFrequencyLimit התדירות הגבוהה ביותר לשימוש בעת חישוב הספקטרום.