Mfcc

genel final sınıfı Mfcc

Spektrogramı konuşma tanıma için kullanışlı bir forma dönüştürür.

Mel Frekansı Cepstral Katsayıları, makine öğrenimi için bir giriş özelliği olarak etkili olan ses verilerini temsil etmenin bir yoludur. Bir spektrogramın (bir 'sepstrum') spektrumu alınarak ve insan kulağı için daha az önemli olan bazı yüksek frekansların atılmasıyla oluşturulurlar. Konuşma tanıma dünyasında uzun bir geçmişleri var ve https://en.wikipedia.org/wiki/Mel-frequency_cepstrum daha fazlasını öğrenmek için iyi bir kaynak.

İç İçe Sınıflar

sınıf Mfcc.Seçenekler Mfcc için isteğe bağlı özellikler

Sabitler

Sicim OP_NAME Bu operasyonun TensorFlow çekirdek motoru tarafından bilinen adı

Genel Yöntemler

Çıkış < TFloat32 >
Çıkış olarak ()
Tensörün sembolik tutamacını döndürür.
statik Mfcc
create ( Kapsam kapsamı, İşlenen < TFloat32 > spektrogram, İşlenen < TInt32 > sampleRate, Seçenekler... seçenekler)
Yeni bir Mfcc işlemini saran bir sınıf oluşturmaya yönelik fabrika yöntemi.
statik Mfcc.Seçenekler
dctCoactiveCount (Uzun dctCoactiveCount)
statik Mfcc.Seçenekler
filterbankChannelCount (Uzun filtre bankasıChannelCount)
statik Mfcc.Seçenekler
altFrequencyLimit (Float altFrequencyLimit)
Çıkış < TFloat32 >
statik Mfcc.Seçenekler
üstFrequencyLimit (Float üstFrequencyLimit)

Kalıtsal Yöntemler

Sabitler

genel statik son Dize OP_NAME

Bu operasyonun TensorFlow çekirdek motoru tarafından bilinen adı

Sabit Değer: "Mfcc"

Genel Yöntemler

genel Çıkış < TFloat32 > asOutput ()

Tensörün sembolik tutamacını döndürür.

TensorFlow işlemlerinin girdileri, başka bir TensorFlow işleminin çıktılarıdır. Bu yöntem, girişin hesaplanmasını temsil eden sembolik bir tanıtıcı elde etmek için kullanılır.

public static Mfcc create ( Kapsam kapsamı, İşlenen < TFloat32 > spektrogram, İşlenen < TInt32 > sampleRate, Seçenekler... seçenekler)

Yeni bir Mfcc işlemini saran bir sınıf oluşturmaya yönelik fabrika yöntemi.

Parametreler
kapsam mevcut kapsam
spektrogram Tipik olarak Spectrogram operasyonu tarafından, magnument_squared true olarak ayarlanarak üretilir.
aynı oran Kaynak sesin saniyede kaç örnek kullandığı.
seçenekler isteğe bağlı nitelik değerlerini taşır
İadeler
  • Mfcc'nin yeni bir örneği

public static Mfcc.Options dctCothirdCount (Long dctCothirdCount)

Parametreler
dctKatsayısıSayısı Zaman dilimi başına kaç çıkış kanalı üretileceği.

genel statik Mfcc.Options filterbankChannelCount (Uzun filtre bankasıChannelCount)

Parametreler
filtre bankasıChannelCount Dahili olarak kullanılan Mel bankasının çözünürlüğü.

public static Mfcc.Options LowerFrequencyLimit (Float LowerFrequencyLimit)

Parametreler
alt FrekansLimit Septtrum hesaplanırken kullanılacak en düşük frekans.

genel Çıkış < TFloat32 > çıkış ()

public static Mfcc.Options UpperFrequencyLimit (Float UpperFrequencyLimit)

Parametreler
üst FrekansLimit Septtrum hesaplanırken kullanılacak en yüksek frekans.