Mfcc

classe finale publique Mfcc

Transforme un spectrogramme en une forme utile pour la reconnaissance vocale.

Les coefficients cepstraux de fréquence Mel sont un moyen de représenter des données audio qui s'est avéré efficace en tant que fonctionnalité d'entrée pour l'apprentissage automatique. Ils sont créés en prenant le spectre d'un spectrogramme (un « cepstre ») et en éliminant certaines des fréquences les plus élevées qui sont moins significatives pour l'oreille humaine. Ils ont une longue histoire dans le monde de la reconnaissance vocale et https://en.wikipedia.org/wiki/Mel- Frequency_cepstrum est une bonne ressource pour en savoir plus.

Classes imbriquées

classe Mfcc.Options Attributs facultatifs pour Mfcc

Constantes

Chaîne OP_NAME Le nom de cette opération, tel que connu par le moteur principal TensorFlow

Méthodes publiques

Sortie < TFloat32 >
comme Sortie ()
Renvoie le handle symbolique du tenseur.
Mfcc statique
créer ( Scope scope, Operand < TFloat32 > spectrogramme, Operand < TInt32 > sampleRate, Options... options)
Méthode d'usine pour créer une classe encapsulant une nouvelle opération Mfcc.
statique Mfcc.Options
dctCoefficientCount (Long dctCoefficientCount)
statique Mfcc.Options
filterbankChannelCount (Long filterbankChannelCount)
statique Mfcc.Options
lowerFrequencyLimit (Float lowerFrequencyLimit)
Sortie < TFloat32 >
sortir ()
statique Mfcc.Options
upperFrequencyLimit (Float upperFrequencyLimit)

Méthodes héritées

Constantes

chaîne finale statique publique OP_NAME

Le nom de cette opération, tel que connu par le moteur principal TensorFlow

Valeur constante : "Mfcc"

Méthodes publiques

Sortie publique < TFloat32 > asOutput ()

Renvoie le handle symbolique du tenseur.

Les entrées des opérations TensorFlow sont les sorties d'une autre opération TensorFlow. Cette méthode est utilisée pour obtenir un handle symbolique qui représente le calcul de l’entrée.

public static Mfcc create ( Scope scope, Operand < TFloat32 > spectrogram, Operand < TInt32 > sampleRate, Options... options)

Méthode d'usine pour créer une classe encapsulant une nouvelle opération Mfcc.

Paramètres
portée portée actuelle
spectrogramme Généralement produit par l'opération Spectrogram, avec magnitude_squared défini sur true.
taux d'échantillonnage Combien d’échantillons par seconde l’audio source a utilisé.
choix porte des valeurs d'attributs facultatifs
Retour
  • une nouvelle instance de Mfcc

public statique Mfcc.Options dctCoefficientCount (Long dctCoefficientCount)

Paramètres
dctCoefficientCount Combien de canaux de sortie produire par tranche de temps.

public statique Mfcc.Options filterbankChannelCount (Long filterbankChannelCount)

Paramètres
filterbankChannelCount Résolution de la banque Mel utilisée en interne.

public statique Mfcc.Options lowerFrequencyLimit (Float lowerFrequencyLimit)

Paramètres
limite de fréquence inférieure La fréquence la plus basse à utiliser lors du calcul du ceptstrum.

Sortie publique < TFloat32 > sortie ()

public static Mfcc.Options upperFrequencyLimit (Float upperFrequencyLimit)

Paramètres
limite de fréquence supérieure La fréquence la plus élevée à utiliser lors du calcul du ceptstrum.