Mfcc

aula final pública Mfcc

Transforma um espectrograma em um formato útil para reconhecimento de fala.

Os coeficientes cepstrais de frequência Mel são uma forma de representar dados de áudio que têm sido eficazes como um recurso de entrada para aprendizado de máquina. Eles são criados pegando o espectro de um espectrograma (um 'cepstrum') e descartando algumas das frequências mais altas que são menos significativas para o ouvido humano. Eles têm uma longa história no mundo do reconhecimento de fala e https://en.wikipedia.org/wiki/Mel-frequency_cepstrum é um bom recurso para aprender mais.

Classes aninhadas

aula Mfcc.Opções Atributos opcionais para Mfcc

Constantes

Corda OP_NAME O nome desta operação, conforme conhecido pelo mecanismo principal do TensorFlow

Métodos Públicos

Saída < TFloat32 >
asOutput ()
Retorna o identificador simbólico do tensor.
Mfcc estático
create ( Escopo do escopo , Operando < TFloat32 > espectrograma, Operando < TInt32 > sampleRate, Opções... opções)
Método de fábrica para criar uma classe que envolve uma nova operação Mfcc.
Mfcc.Options estático
dctCoeficienteCount (dctCoeficienteCount longo)
Mfcc.Options estático
filterbankChannelCount (filtrobankChannelCount longo)
Mfcc.Options estático
lowerFrequencyLimit (flutuante lowerFrequencyLimit)
Saída < TFloat32 >
saída ()
Mfcc.Options estático
UpperFrequencyLimit (Float UpperFrequencyLimit)

Métodos herdados

Constantes

String final estática pública OP_NAME

O nome desta operação, conforme conhecido pelo mecanismo principal do TensorFlow

Valor Constante: "Mfcc"

Métodos Públicos

Saída pública < TFloat32 > asOutput ()

Retorna o identificador simbólico do tensor.

As entradas para operações do TensorFlow são saídas de outra operação do TensorFlow. Este método é usado para obter um identificador simbólico que representa o cálculo da entrada.

public static Mfcc create ( Escopo do escopo , Operando < TFloat32 > espectrograma, Operando < TInt32 > sampleRate, Opções... opções)

Método de fábrica para criar uma classe que envolve uma nova operação Mfcc.

Parâmetros
escopo escopo atual
espectrograma Normalmente produzido pela operação Spectrogram, com magnitude_squared definido como verdadeiro.
taxa de amostragem Quantas amostras por segundo o áudio de origem usou.
opções carrega valores de atributos opcionais
Devoluções
  • uma nova instância do Mfcc

público estático Mfcc.Options dctCoeficienteCount (dctCoeficienteCount longo)

Parâmetros
dctCoeficienteCount Quantos canais de saída produzir por intervalo de tempo.

público estático Mfcc.Options filterbankChannelCount (filtrobankChannelCount longo)

Parâmetros
banco de filtrosChannelCount Resolução do banco Mel utilizada internamente.

public static Mfcc.Options lowerFrequencyLimit (Float lowerFrequencyLimit)

Parâmetros
limite de frequência inferior A frequência mais baixa a ser usada no cálculo do ceptstrum.

Saída pública < TFloat32 > saída ()

público estático Mfcc.Options UpperFrequencyLimit (Float UpperFrequencyLimit)

Parâmetros
limite de frequência superior A frequência mais alta a ser usada no cálculo do ceptstrum.