Trasforma uno spettrogramma in una forma utile per il riconoscimento vocale.
I coefficienti celestiali di frequenza Mel sono un modo di rappresentare i dati audio che si è rivelato efficace come funzionalità di input per l'apprendimento automatico. Vengono creati prendendo lo spettro di uno spettrogramma (un "cepstrum") e scartando alcune delle frequenze più alte che sono meno significative per l'orecchio umano. Hanno una lunga storia nel mondo del riconoscimento vocale e https://en.wikipedia.org/wiki/Mel-frequency_cepstrum è una buona risorsa per saperne di più.
Classi nidificate
classe | Opzioni Mfcc | Attributi facoltativi per Mfcc |
Costanti
Corda | OP_NAME | Il nome di questa operazione, come noto al motore principale di TensorFlow |
Metodi pubblici
Uscita < TFloat32 > | comeuscita () Restituisce l'handle simbolico del tensore. |
Mfcc statico | |
Opzioni Mfcc statiche | dctCoefficientCount (dctCoefficientCount lungo) |
Opzioni Mfcc statiche | filterbankChannelCount (filtro lungobankChannelCount) |
Opzioni Mfcc statiche | lowerFrequencyLimit (Limite inferiore di frequenza mobile) |
Uscita < TFloat32 > | produzione () |
Opzioni Mfcc statiche | limitefrequenza superiore (Limite frequenza superiore mobile) |
Metodi ereditati
Costanti
Stringa finale statica pubblica OP_NAME
Il nome di questa operazione, come noto al motore principale di TensorFlow
Metodi pubblici
Uscita pubblica < TFloat32 > asOutput ()
Restituisce l'handle simbolico del tensore.
Gli input per le operazioni TensorFlow sono output di un'altra operazione TensorFlow. Questo metodo viene utilizzato per ottenere un handle simbolico che rappresenta il calcolo dell'input.
creazione Mfcc statica pubblica (ambito ambito , operando < TFloat32 > spettrogramma, operando < TInt32 > sampleRate, opzioni... )
Metodo factory per creare una classe che racchiude una nuova operazione Mfcc.
Parametri
scopo | ambito attuale |
---|---|
spettrogramma | Tipicamente prodotto dall'operazione Spectrogram, con magnitudo_quadrata impostato su true. |
frequenza di campionamento | Quanti campioni al secondo ha utilizzato l'audio sorgente. |
opzioni | trasporta valori di attributi opzionali |
ritorna
- una nuova istanza di Mfcc
public static Mfcc.Options dctCoefficientCount (Long dctCoefficientCount)
Parametri
dctCoefficientCount | Quanti canali di output produrre per intervallo di tempo. |
---|
public static Mfcc.Options filterbankChannelCount (filtro lungo bankChannelCount)
Parametri
filterbankChannelCount | Risoluzione della banca Mel utilizzata internamente. |
---|
public static Mfcc.Options lowerFrequencyLimit (Float lowerFrequencyLimit)
Parametri
limite di frequenza inferiore | La frequenza più bassa da utilizzare per calcolare il ceptstrum. |
---|
public static Mfcc.Options upperFrequencyLimit (Float upperFrequencyLimit)
Parametri
limite di frequenza superiore | La frequenza più alta da utilizzare per il calcolo del ceptstrum. |
---|