Transforme un spectrogramme en une forme utile pour la reconnaissance vocale.
Les coefficients cepstraux de fréquence Mel sont un moyen de représenter des données audio qui s'est avéré efficace en tant que fonctionnalité d'entrée pour l'apprentissage automatique. Ils sont créés en prenant le spectre d'un spectrogramme (un « cepstre ») et en éliminant certaines des fréquences les plus élevées qui sont moins significatives pour l'oreille humaine. Ils ont une longue histoire dans le monde de la reconnaissance vocale et https://en.wikipedia.org/wiki/Mel- Frequency_cepstrum est une bonne ressource pour en savoir plus.
Classes imbriquées
classe | Mfcc.Options | Attributs facultatifs pour Mfcc |
Constantes
Chaîne | OP_NAME | Le nom de cette opération, tel que connu par le moteur principal TensorFlow |
Méthodes publiques
Sortie < TFloat32 > | comme Sortie () Renvoie le handle symbolique du tenseur. |
Mfcc statique | |
statique Mfcc.Options | dctCoefficientCount (Long dctCoefficientCount) |
statique Mfcc.Options | filterbankChannelCount (Long filterbankChannelCount) |
statique Mfcc.Options | lowerFrequencyLimit (Float lowerFrequencyLimit) |
Sortie < TFloat32 > | sortir () |
statique Mfcc.Options | upperFrequencyLimit (Float upperFrequencyLimit) |
Méthodes héritées
Constantes
chaîne finale statique publique OP_NAME
Le nom de cette opération, tel que connu par le moteur principal TensorFlow
Méthodes publiques
Sortie publique < TFloat32 > asOutput ()
Renvoie le handle symbolique du tenseur.
Les entrées des opérations TensorFlow sont les sorties d'une autre opération TensorFlow. Cette méthode est utilisée pour obtenir un handle symbolique qui représente le calcul de l’entrée.
public static Mfcc create ( Scope scope, Operand < TFloat32 > spectrogram, Operand < TInt32 > sampleRate, Options... options)
Méthode d'usine pour créer une classe encapsulant une nouvelle opération Mfcc.
Paramètres
portée | portée actuelle |
---|---|
spectrogramme | Généralement produit par l'opération Spectrogram, avec magnitude_squared défini sur true. |
taux d'échantillonnage | Combien d’échantillons par seconde l’audio source a utilisé. |
choix | porte des valeurs d'attributs facultatifs |
Retour
- une nouvelle instance de Mfcc
public statique Mfcc.Options dctCoefficientCount (Long dctCoefficientCount)
Paramètres
dctCoefficientCount | Combien de canaux de sortie produire par tranche de temps. |
---|
public statique Mfcc.Options filterbankChannelCount (Long filterbankChannelCount)
Paramètres
filterbankChannelCount | Résolution de la banque Mel utilisée en interne. |
---|
public statique Mfcc.Options lowerFrequencyLimit (Float lowerFrequencyLimit)
Paramètres
limite de fréquence inférieure | La fréquence la plus basse à utiliser lors du calcul du ceptstrum. |
---|
public static Mfcc.Options upperFrequencyLimit (Float upperFrequencyLimit)
Paramètres
limite de fréquence supérieure | La fréquence la plus élevée à utiliser lors du calcul du ceptstrum. |
---|