Transforma um espectrograma em um formato útil para reconhecimento de fala.
Os coeficientes cepstrais de frequência Mel são uma forma de representar dados de áudio que têm sido eficazes como um recurso de entrada para aprendizado de máquina. Eles são criados pegando o espectro de um espectrograma (um 'cepstrum') e descartando algumas das frequências mais altas que são menos significativas para o ouvido humano. Eles têm uma longa história no mundo do reconhecimento de fala e https://en.wikipedia.org/wiki/Mel-frequency_cepstrum é um bom recurso para aprender mais.
Classes aninhadas
aula | Mfcc.Opções | Atributos opcionais para Mfcc |
Constantes
Corda | OP_NAME | O nome desta operação, conforme conhecido pelo mecanismo principal do TensorFlow |
Métodos Públicos
Saída < TFloat32 > | asOutput () Retorna o identificador simbólico do tensor. |
Mfcc estático | |
Mfcc.Options estático | dctCoeficienteCount (dctCoeficienteCount longo) |
Mfcc.Options estático | filterbankChannelCount (filtrobankChannelCount longo) |
Mfcc.Options estático | lowerFrequencyLimit (flutuante lowerFrequencyLimit) |
Saída < TFloat32 > | saída () |
Mfcc.Options estático | UpperFrequencyLimit (Float UpperFrequencyLimit) |
Métodos herdados
Constantes
String final estática pública OP_NAME
O nome desta operação, conforme conhecido pelo mecanismo principal do TensorFlow
Métodos Públicos
Saída pública < TFloat32 > asOutput ()
Retorna o identificador simbólico do tensor.
As entradas para operações do TensorFlow são saídas de outra operação do TensorFlow. Este método é usado para obter um identificador simbólico que representa o cálculo da entrada.
public static Mfcc create ( Escopo do escopo , Operando < TFloat32 > espectrograma, Operando < TInt32 > sampleRate, Opções... opções)
Método de fábrica para criar uma classe que envolve uma nova operação Mfcc.
Parâmetros
escopo | escopo atual |
---|---|
espectrograma | Normalmente produzido pela operação Spectrogram, com magnitude_squared definido como verdadeiro. |
taxa de amostragem | Quantas amostras por segundo o áudio de origem usou. |
opções | carrega valores de atributos opcionais |
Devoluções
- uma nova instância do Mfcc
público estático Mfcc.Options dctCoeficienteCount (dctCoeficienteCount longo)
Parâmetros
dctCoeficienteCount | Quantos canais de saída produzir por intervalo de tempo. |
---|
público estático Mfcc.Options filterbankChannelCount (filtrobankChannelCount longo)
Parâmetros
banco de filtrosChannelCount | Resolução do banco Mel utilizada internamente. |
---|
public static Mfcc.Options lowerFrequencyLimit (Float lowerFrequencyLimit)
Parâmetros
limite de frequência inferior | A frequência mais baixa a ser usada no cálculo do ceptstrum. |
---|
público estático Mfcc.Options UpperFrequencyLimit (Float UpperFrequencyLimit)
Parâmetros
limite de frequência superior | A frequência mais alta a ser usada no cálculo do ceptstrum. |
---|