パブリック最終クラスMfcc
スペクトログラムを音声認識に役立つ形式に変換します。
メル周波数ケプストラム係数は、機械学習の入力特徴として効果的な音声データを表現する方法です。これらは、スペクトログラムのスペクトル (「ケプストラム」) を取得し、人間の耳にはそれほど重要ではない高い周波数の一部を破棄することによって作成されます。音声認識の世界では長い歴史があり、https://en.wikipedia.org/wiki/Mel-frequency_cepstrum は詳細を学ぶのに良いリソースです。
ネストされたクラス
クラス | 製造オプション | Mfcc のオプションの属性 |
定数
弦 | OP_NAME | TensorFlow コア エンジンによって認識される、この演算の名前 |
パブリックメソッド
出力< TFloat32 > | asOutput () テンソルのシンボリック ハンドルを返します。 |
静的Mfcc | |
静的Mfcc.Options | dctCoefficientCount (長い dctCoefficientCount) |
静的Mfcc.Options | filterbankChannelCount (長いフィルターバンクチャンネル数) |
静的Mfcc.Options | lowerFrequencyLimit (浮動小数点 lowerFrequencyLimit) |
出力< TFloat32 > | 出力() |
静的Mfcc.Options | upperFrequencyLimit (浮動小数点上限周波数制限) |
継承されたメソッド
定数
パブリック静的最終文字列OP_NAME
TensorFlow コア エンジンによって認識される、この演算の名前
定数値: "Mfcc"
パブリックメソッド
public Output < TFloat32 > asOutput ()
テンソルのシンボリック ハンドルを返します。
TensorFlow オペレーションへの入力は、別の TensorFlow オペレーションの出力です。このメソッドは、入力の計算を表すシンボリック ハンドルを取得するために使用されます。
public static Mfcc create (スコープスコープ、オペランド< TFloat32 > スペクトログラム、オペランド< TInt32 > sampleRate、オプション...オプション)
新しい Mfcc 操作をラップするクラスを作成するファクトリ メソッド。
パラメーター
範囲 | 現在のスコープ |
---|---|
スペクトログラム | 通常は、magnitude_squared が true に設定された Spectrogram 演算によって生成されます。 |
サンプルレート | ソースオーディオが 1 秒あたりに使用したサンプル数。 |
オプション | オプションの属性値を持ちます |
戻り値
- Mfcc の新しいインスタンス
public static Mfcc.Options dctCoefficientCount (Long dctCoefficientCount)
パラメーター
dct係数数 | タイム スライスごとに生成する出力チャネルの数。 |
---|
public static Mfcc.Options filterbankChannelCount (Long filterbankChannelCount)
パラメーター
フィルターバンクチャンネル数 | 内部で使用されるメルバンクの解像度。 |
---|
public static Mfcc.Options lowerFrequencyLimit (Float lowerFrequencyLimit)
パラメーター
下限周波数制限 | セプストラムを計算するときに使用する最低周波数。 |
---|
public static Mfcc.Options upperFrequencyLimit (Float upperFrequencyLimit)
パラメーター
周波数上限 | セプストラムを計算するときに使用する最高周波数。 |
---|