Mfcc

genel final sınıfı Mfcc

Spektrogramı konuşma tanıma için kullanışlı bir forma dönüştürür.

Mel Frekansı Cepstral Katsayıları, makine öğrenimi için bir giriş özelliği olarak etkili olan ses verilerini temsil etmenin bir yoludur. Bir spektrogramın (bir 'sepstrum') spektrumu alınarak ve insan kulağı için daha az önemli olan bazı yüksek frekansların atılmasıyla oluşturulurlar. Konuşma tanıma dünyasında uzun bir geçmişleri var ve https://en.wikipedia.org/wiki/Mel-frequency_cepstrum daha fazlasını öğrenmek için iyi bir kaynak.

İç İçe Sınıflar

sınıf Mfcc.Seçenekler Mfcc için isteğe bağlı özellikler

Sabitler

Sicim OP_NAME Bu operasyonun TensorFlow çekirdek motoru tarafından bilinen adı

Genel Yöntemler

Çıkış < TFloat32 >
Çıkış olarak ()
Tensörün sembolik tutamacını döndürür.
statik Mfcc
create ( Kapsam kapsamı, İşlenen < TFloat32 > spektrogram, İşlenen < TInt32 > sampleRate, Seçenekler... seçenekler)
Yeni bir Mfcc işlemini saran bir sınıf oluşturmaya yönelik fabrika yöntemi.
statik Mfcc.Seçenekler
dctCoactiveCount (Uzun dctCoactiveCount)
statik Mfcc.Seçenekler
filterbankChannelCount (Uzun filtre bankasıChannelCount)
statik Mfcc.Seçenekler
altFrequencyLimit (Float altFrequencyLimit)
Çıkış < TFloat32 >
statik Mfcc.Seçenekler
üstFrequencyLimit (Float üstFrequencyLimit)

Kalıtsal Yöntemler

org.tensorflow.op.RawOp sınıfından
son boole değeri
eşittir (Nesne nesnesi)
son int
Operasyon
işlem ()
Bu hesaplama birimini tek bir Operation olarak döndürün.
son Dize
boolean
eşittir (Nesne arg0)
son Sınıf<?>
getClass ()
int
hash kodu ()
son boşluk
bildir ()
son boşluk
tümünü bildir ()
Sicim
toString ()
son boşluk
bekle (uzun arg0, int arg1)
son boşluk
bekle (uzun arg0)
son boşluk
Beklemek ()
org.tensorflow.op.Op arayüzünden
özet Yürütme Ortamı
env ()
Bu operasyonun oluşturulduğu yürütme ortamını döndürün.
soyut Operasyon
işlem ()
Bu hesaplama birimini tek bir Operation olarak döndürün.
org.tensorflow.Operand arayüzünden
özet Çıkış < TFloat32 >
Çıkış olarak ()
Tensörün sembolik tutamacını döndürür.
özet TFloat32
Tensör olarak ()
Bu işlenendeki tensörü döndürür.
soyut Şekil
şekil ()
Bu işlenenin Output tarafından başvurulan tensörün (muhtemelen kısmen bilinen) şeklini döndürür.
soyut Sınıf< TFloat32 >
tip ()
Bu işlenenin tensör türünü döndürür
org.tensorflow.ndarray.Shaped arayüzünden
soyut int
rütbe ()
soyut Şekil
şekil ()
soyut uzun
boyut ()
Bu kabın toplam boyutunu değer sayısı cinsinden hesaplar ve döndürür.

Sabitler

genel statik son Dize OP_NAME

Bu operasyonun TensorFlow çekirdek motoru tarafından bilinen adı

Sabit Değer: "Mfcc"

Genel Yöntemler

genel Çıkış < TFloat32 > asOutput ()

Tensörün sembolik tutamacını döndürür.

TensorFlow işlemlerinin girdileri, başka bir TensorFlow işleminin çıktılarıdır. Bu yöntem, girişin hesaplanmasını temsil eden sembolik bir tanıtıcı elde etmek için kullanılır.

public static Mfcc create ( Kapsam kapsamı, İşlenen < TFloat32 > spektrogram, İşlenen < TInt32 > sampleRate, Seçenekler... seçenekler)

Yeni bir Mfcc işlemini saran bir sınıf oluşturmaya yönelik fabrika yöntemi.

Parametreler
kapsam mevcut kapsam
spektrogram Tipik olarak Spectrogram operasyonu tarafından, magnument_squared true olarak ayarlanarak üretilir.
aynı oran Kaynak sesin saniyede kaç örnek kullandığı.
seçenekler isteğe bağlı nitelik değerlerini taşır
İadeler
  • Mfcc'nin yeni bir örneği

public static Mfcc.Options dctCothirdCount (Long dctCothirdCount)

Parametreler
dctKatsayısıSayısı Zaman dilimi başına kaç çıkış kanalı üretileceği.

genel statik Mfcc.Options filterbankChannelCount (Uzun filtre bankasıChannelCount)

Parametreler
filtre bankasıChannelCount Dahili olarak kullanılan Mel bankasının çözünürlüğü.

public static Mfcc.Options LowerFrequencyLimit (Float LowerFrequencyLimit)

Parametreler
alt FrekansLimit Septtrum hesaplanırken kullanılacak en düşük frekans.

genel Çıkış < TFloat32 > çıkış ()

public static Mfcc.Options UpperFrequencyLimit (Float UpperFrequencyLimit)

Parametreler
üst FrekansLimit Septtrum hesaplanırken kullanılacak en yüksek frekans.