このページは Cloud Translation API によって翻訳されました。

Mfcc

パブリック最終クラスMfcc

スペクトログラムを音声認識に役立つ形式に変換します。

メル周波数ケプストラム係数は、機械学習の入力特徴として効果的な音声データを表現する方法です。これらは、スペクトログラムのスペクトル (「ケプストラム」) を取得し、人間の耳にはそれほど重要ではない高い周波数の一部を破棄することによって作成されます。音声認識の世界では長い歴史があり、https://en.wikipedia.org/wiki/Mel-frequency_cepstrum は詳細を学ぶのに良いリソースです。

ネストされたクラス

クラス製造オプション Mfccのオプションの属性

定数

弦 OP_NAME TensorFlow コアエンジンによって認識される、この演算の名前

パブリックメソッド

出力< TFloat32 >	asOutput () テンソルのシンボリックハンドルを返します。
静的Mfcc	create (スコープscope、オペランド <TFloat32>スペクトログラム、オペランド <TInt32> sampleRate、オプション...オプション) 新しい Mfcc 操作をラップするクラスを作成するファクトリメソッド。
静的Mfcc.Options	dctCoefficientCount (長い dctCoefficientCount)
静的Mfcc.Options	filterbankChannelCount (長いフィルターバンクチャンネル数)
静的Mfcc.Options	lowerFrequencyLimit (浮動小数点 lowerFrequencyLimit)
出力< TFloat32 >	出力()
静的Mfcc.Options	upperFrequencyLimit (浮動小数点上限周波数制限)

継承されたメソッド

クラスorg.tensorflow.op.RawOpから

最終ブール値	等しい(オブジェクトオブジェクト)
最終整数	ハッシュコード（）
手術	オプ() この計算単位を単一の`Operation`として返します。
最後の文字列	toString ()

クラスjava.lang.Objectから

ブール値	等しい(オブジェクト arg0)
最終クラス<?>	getクラス()
整数	ハッシュコード（）
最後の空白	通知する()
最後の空白	すべて通知()
弦	toString ()
最後の空白	wait (long arg0, int arg1)
最後の空白	待機(長い引数0)
最後の空白	待って（）

インターフェースorg.tensorflow.op.Opから

抽象的な実行環境	環境() このオペレーションが作成された実行環境を返します。
抽象的な操作	オプ() この計算単位を単一の`Operation`として返します。

インターフェースorg.tensorflow.Operandから

抽象出力< TFloat32 >	asOutput () テンソルのシンボリックハンドルを返します。
抽象TFloat32	asTensor () このオペランドのテンソルを返します。
抽象的な形	形（）このオペランドの`Output`によって参照されるテンソルの (おそらく部分的に既知の) 形状を返します。
抽象クラス< TFloat32 >	タイプ（）このオペランドのテンソル型を返します。

インターフェースorg.tensorflow.ndarray.Shapedから

抽象整数	ランク（）
抽象的な形	形（）
抽象的な長い	サイズ（）このコンテナの合計サイズを値の数で計算して返します。

定数

パブリック静的最終文字列OP_NAME

TensorFlow コアエンジンによって認識される、この演算の名前

定数値: "Mfcc"

パブリックメソッド

public Output < TFloat32 > asOutput ()

テンソルのシンボリックハンドルを返します。

TensorFlow オペレーションへの入力は、別の TensorFlow オペレーションの出力です。このメソッドは、入力の計算を表すシンボリックハンドルを取得するために使用されます。

public static Mfcc create (スコープスコープ、オペランド< TFloat32 > スペクトログラム、オペランド< TInt32 > sampleRate、オプション...オプション)

新しい Mfcc 操作をラップするクラスを作成するファクトリメソッド。

パラメーター

範囲	現在のスコープ
スペクトログラム	通常は、magnitude_squared が true に設定された Spectrogram 演算によって生成されます。
サンプルレート	ソースオーディオが 1 秒あたりに使用したサンプル数。
オプション	オプションの属性値を持ちます

戻り値

Mfcc の新しいインスタンス

public static Mfcc.Options dctCoefficientCount (Long dctCoefficientCount)

パラメーター

dct係数数	タイムスライスごとに生成する出力チャネルの数。

public static Mfcc.Options filterbankChannelCount (Long filterbankChannelCount)

パラメーター

フィルターバンクチャンネル数	内部で使用されるメルバンクの解像度。

public static Mfcc.Options lowerFrequencyLimit (Float lowerFrequencyLimit)

パラメーター

下限周波数制限	セプストラムを計算するときに使用する最低周波数。

public出力< TFloat32 >出力()

public static Mfcc.Options upperFrequencyLimit (Float upperFrequencyLimit)

パラメーター

周波数上限	セプストラムを計算するときに使用する最高周波数。