Mengubah spektogram menjadi bentuk yang berguna untuk pengenalan suara.
Koefisien Cepstral Frekuensi Mel adalah cara merepresentasikan data audio yang efektif sebagai fitur masukan untuk pembelajaran mesin. Mereka diciptakan dengan mengambil spektrum spektogram ('cepstrum'), dan membuang beberapa frekuensi tinggi yang kurang signifikan bagi telinga manusia. Mereka memiliki sejarah panjang dalam dunia pengenalan suara, dan https://en.wikipedia.org/wiki/Mel-frekuensi_cepstrum adalah sumber yang bagus untuk mempelajari lebih lanjut.
Kelas Bersarang
kelas | Mfcc.Opsi | Atribut opsional untuk Mfcc |
Konstanta
Rangkaian | OP_NAME | Nama operasi ini dikenal dengan mesin inti TensorFlow |
Metode Publik
Keluaran < TFloat32 > | sebagai Keluaran () Mengembalikan pegangan simbolik tensor. |
Mfcc statis | |
Mfcc.Options statis | dctCoefisienCount (dctCoefisienCount panjang) |
Mfcc.Options statis | filterbankChannelCount (FilterbankChannelCount panjang) |
Mfcc.Options statis | LowerFrequencyLimit (Batas Frekuensi Rendah Float) |
Keluaran < TFloat32 > | keluaran () |
Mfcc.Options statis | BatasFrekuensi atas (BatasFrekuensi Atas Apung) |
Metode Warisan
Konstanta
String akhir statis publik OP_NAME
Nama operasi ini dikenal dengan mesin inti TensorFlow
Metode Publik
Keluaran publik < TFloat32 > asOutput ()
Mengembalikan pegangan simbolik tensor.
Masukan ke operasi TensorFlow adalah keluaran dari operasi TensorFlow lainnya. Metode ini digunakan untuk mendapatkan pegangan simbolis yang mewakili perhitungan input.
pembuatan Mfcc statis publik ( Lingkup lingkup, Operan < TFloat32 > spektogram, Operan < TInt32 > sampleRate, Opsi... opsi)
Metode pabrik untuk membuat kelas yang membungkus operasi Mfcc baru.
Parameter
cakupan | ruang lingkup saat ini |
---|---|
spektogram | Biasanya dihasilkan oleh operasi Spectogram, dengan magnitudo_squared disetel ke true. |
tingkat sampel | Berapa banyak sampel per detik sumber audio yang digunakan. |
pilihan | membawa nilai atribut opsional |
Kembali
- contoh baru dari Mfcc
Mfcc.Options statis publik dctCoefisienCount (DctCoefisienCount panjang)
Parameter
dctCoefisienCount | Berapa banyak saluran keluaran yang harus diproduksi per irisan waktu. |
---|
public static Mfcc.Options filterbankChannelCount (FilterbankChannelCount panjang)
Parameter
filterbankChannelCount | Resolusi bank Mel digunakan secara internal. |
---|
Mfcc.Options lowerFrequencyLimit statis publik (Float lowerFrequencyLimit)
Parameter
Batas Frekuensi yang lebih rendah | Frekuensi terendah yang digunakan saat menghitung cepttrum. |
---|
Mfcc.Options upperFrequencyLimit statis publik (Float upperFrequencyLimit)
Parameter
Batas Frekuensi atas | Frekuensi tertinggi yang digunakan saat menghitung cepttrum. |
---|