Mfcc

classe finale pubblica Mfcc

Trasforma uno spettrogramma in una forma utile per il riconoscimento vocale.

I coefficienti celestiali di frequenza Mel sono un modo di rappresentare i dati audio che si è rivelato efficace come funzionalità di input per l'apprendimento automatico. Vengono creati prendendo lo spettro di uno spettrogramma (un "cepstrum") e scartando alcune delle frequenze più alte che sono meno significative per l'orecchio umano. Hanno una lunga storia nel mondo del riconoscimento vocale e https://en.wikipedia.org/wiki/Mel-frequency_cepstrum è una buona risorsa per saperne di più.

Classi nidificate

classe Opzioni Mfcc Attributi facoltativi per Mfcc

Costanti

Corda OP_NAME Il nome di questa operazione, come noto al motore principale di TensorFlow

Metodi pubblici

Uscita < TFloat32 >
comeuscita ()
Restituisce l'handle simbolico del tensore.
Mfcc statico
create ( Scope scope, Operando < TFloat32 > spettrogramma, Operando < TInt32 > sampleRate, Opzioni... opzioni)
Metodo factory per creare una classe che racchiude una nuova operazione Mfcc.
Opzioni Mfcc statiche
dctCoefficientCount (dctCoefficientCount lungo)
Opzioni Mfcc statiche
filterbankChannelCount (filtro lungobankChannelCount)
Opzioni Mfcc statiche
lowerFrequencyLimit (Limite inferiore di frequenza mobile)
Uscita < TFloat32 >
Opzioni Mfcc statiche
limitefrequenza superiore (Limite frequenza superiore mobile)

Metodi ereditati

Costanti

Stringa finale statica pubblica OP_NAME

Il nome di questa operazione, come noto al motore principale di TensorFlow

Valore costante: "Mfcc"

Metodi pubblici

Uscita pubblica < TFloat32 > asOutput ()

Restituisce l'handle simbolico del tensore.

Gli input per le operazioni TensorFlow sono output di un'altra operazione TensorFlow. Questo metodo viene utilizzato per ottenere un handle simbolico che rappresenta il calcolo dell'input.

creazione Mfcc statica pubblica (ambito ambito , operando < TFloat32 > spettrogramma, operando < TInt32 > sampleRate, opzioni... )

Metodo factory per creare una classe che racchiude una nuova operazione Mfcc.

Parametri
scopo ambito attuale
spettrogramma Tipicamente prodotto dall'operazione Spectrogram, con magnitudo_quadrata impostato su true.
frequenza di campionamento Quanti campioni al secondo ha utilizzato l'audio sorgente.
opzioni trasporta valori di attributi opzionali
ritorna
  • una nuova istanza di Mfcc

public static Mfcc.Options dctCoefficientCount (Long dctCoefficientCount)

Parametri
dctCoefficientCount Quanti canali di output produrre per intervallo di tempo.

public static Mfcc.Options filterbankChannelCount (filtro lungo bankChannelCount)

Parametri
filterbankChannelCount Risoluzione della banca Mel utilizzata internamente.

public static Mfcc.Options lowerFrequencyLimit (Float lowerFrequencyLimit)

Parametri
limite di frequenza inferiore La frequenza più bassa da utilizzare per calcolare il ceptstrum.

Uscita pubblica < TFloat32 > uscita ()

public static Mfcc.Options upperFrequencyLimit (Float upperFrequencyLimit)

Parametri
limite di frequenza superiore La frequenza più alta da utilizzare per il calcolo del ceptstrum.