Mfcc

کلاس نهایی عمومی Mfcc

یک طیف نگار را به شکلی تبدیل می کند که برای تشخیص گفتار مفید است.

Mel Frequency Cepstral Coefficients راهی برای نمایش داده های صوتی است که به عنوان یک ویژگی ورودی برای یادگیری ماشین موثر بوده است. آنها با گرفتن طیف یک طیف‌نگار (یک «سپستروم»)، و دور انداختن برخی از فرکانس‌های بالاتر که برای گوش انسان اهمیت کمتری دارند، ایجاد می‌شوند. آنها سابقه طولانی در دنیای تشخیص گفتار دارند و https://en.wikipedia.org/wiki/Mel-frequency_cepsrum منبع خوبی برای کسب اطلاعات بیشتر است.

کلاس های تو در تو

کلاس Mfcc.Options ویژگی های اختیاری برای Mfcc

ثابت ها

رشته OP_NAME نام این عملیات، همانطور که توسط موتور هسته TensorFlow شناخته می شود

روش های عمومی

خروجی < TFloat32 >
asOutput ()
دسته نمادین تانسور را برمی گرداند.
Mfcc استاتیک
ایجاد ( scope scope، Operand < TFloat32 > spectrogram، Operand < TINT32 > sampleRate، Options... گزینه ها)
روش کارخانه برای ایجاد کلاسی که عملیات Mfcc جدید را بسته بندی می کند.
Static Mfcc.Options
dctCoefficientCount (تعداد ضریب طولانی dct)
Static Mfcc.Options
filterbankChannelCount (Long filterbankChannelCount)
Static Mfcc.Options
LowFrequencyLimit (Float LowFrequencyLimit)
خروجی < TFloat32 >
Static Mfcc.Options
upperFrequencyLimit (Float upperFrequencyLimit)

روش های ارثی

org.tensorflow.op.RawOp
بولی نهایی
برابر است (object obj)
بین المللی نهایی
عمل
عملیات ()
این واحد محاسبه را به عنوان یک Operation واحد برگردانید.
رشته نهایی
بولی
برابر است (شیء arg0)
کلاس نهایی<?>
getClass ()
بین المللی
هش کد ()
باطل نهایی
اعلام کردن ()
باطل نهایی
اطلاع رسانی به همه ()
رشته
toString ()
باطل نهایی
صبر کنید (long arg0، int arg1)
باطل نهایی
صبر کنید (طولانی arg0)
باطل نهایی
صبر کن ()
org.tensorflow.op.Op
چکیده Execution Environment
env ()
محیط اجرایی را که این عملیات در آن ایجاد شده است برگردانید.
عملیات انتزاعی
عملیات ()
این واحد محاسبه را به عنوان یک Operation واحد برگردانید.
org.tensorflow.Operand
خروجی چکیده < TFloat32 >
asOutput ()
دسته نمادین تانسور را برمی گرداند.
چکیده TFloat32
asTensor ()
تانسور این عملوند را برمی گرداند.
شکل انتزاعی
شکل ()
شکل (احتمالاً تا حدی شناخته شده) تانسور را که توسط Output این عملوند به آن اشاره شده است، برمی گرداند.
کلاس انتزاعی< TFloat32 >
نوع ()
نوع تانسور این عملوند را برمی گرداند
org.tensorflow.ndarray.Shaped
انتزاعی
شکل انتزاعی
شکل ()
انتزاعی طولانی
اندازه ()
اندازه کل این ظرف را به تعداد مقادیر محاسبه کرده و برمی گرداند.

ثابت ها

رشته نهایی ثابت عمومی OP_NAME

نام این عملیات، همانطور که توسط موتور هسته TensorFlow شناخته می شود

مقدار ثابت: "Mfcc"

روش های عمومی

خروجی عمومی < TFloat32 > asOutput ()

دسته نمادین تانسور را برمی گرداند.

ورودی های عملیات TensorFlow خروجی های عملیات تنسورفلو دیگر هستند. این روش برای به دست آوردن یک دسته نمادین که نشان دهنده محاسبه ورودی است استفاده می شود.

ایجاد Mfcc استاتیک عمومی (حوزه دامنه ، عملوند < TFloat32 > طیف نگار، عملوند < TINT32 > نرخ نمونه، گزینه‌ها... گزینه‌ها)

روش کارخانه برای ایجاد کلاسی که عملیات Mfcc جدید را بسته بندی می کند.

مولفه های
محدوده محدوده فعلی
طیف نگار معمولاً توسط Spectrogram op تولید می‌شود، با magnitude_squared تنظیم شده روی true.
نرخ نمونه چند نمونه در ثانیه از صدای منبع استفاده شده است.
گزینه ها مقادیر ویژگی های اختیاری را حمل می کند
برمی گرداند
  • یک نمونه جدید از Mfcc

عمومی static Mfcc.Options dctCoefficientCount (Long dctCoefficientCount)

مولفه های
dctCoefficientCount چند کانال خروجی در هر برش زمانی تولید شود.

عمومی static Mfcc.Options filterbankChannelCount (Long filterbankChannelCount)

مولفه های
filterbankChannelCount قطعنامه بانک مل استفاده داخلی.

Public Static Mfcc.Options LowFrequencyLimit (Float lowFrequencyLimit)

مولفه های
محدود فرکانس پایین کمترین فرکانس مورد استفاده در هنگام محاسبه سپستروم.

خروجی عمومی < TFloat32 > خروجی ()

عمومی static Mfcc.Options upperFrequencyLimit (Float upperFrequencyLimit)

مولفه های
محدودیت فرکانس بالا بیشترین فرکانس مورد استفاده در هنگام محاسبه سپستروم.