DecodeWav

パブリック最終クラスDecodeWav

16 ビット PCM WAV ファイルを浮動小数点テンソルにデコードします。

-32768 ~ 32767 の符号付き 16 ビット値は、float で -1.0 ~ 1.0 にスケールされます。

desired_channels が設定されている場合、入力に含まれるチャネルがこれより少ない場合、最後のチャネルが複製されて要求された数が与えられます。そうでない場合、入力に要求されたチャネルよりも多くのチャネルが含まれる場合、追加のチャネルは無視されます。

desired_samples が設定されている場合、オーディオは切り取られるか、要求された長さまでゼロが埋め込まれます。

最初の出力には、オーディオ サンプルのコンテンツを含む Tensor が含まれています。最も低い次元はチャンネル数、2 番目はサンプル数になります。たとえば、10 サンプルの長さのステレオ WAV ファイルの出力形状は [10, 2] になります。

ネストされたクラス

クラスデコードWav.オプションDecodeWavのオプションの属性

定数

OP_NAME TensorFlow コア エンジンによって認識される、この演算の名前

パブリックメソッド

出力< TFloat32 >
オーディオ()
形状 `[長さ、チャネル]` の 2 次元。
静的デコードWav
create (スコープスコープ、オペランド< TString > 内容、オプション...オプション)
新しい DecodeWav 操作をラップするクラスを作成するファクトリ メソッド。
静的DecodeWav.Options
desiredChannels (長い望ましいチャネル)
静的DecodeWav.Options
望ましいサンプル(長い間望ましいサンプル)
出力< TInt32 >
サンプルレート()
WAV ヘッダーにあるサンプル レートを保持するスカラー。

継承されたメソッド

定数

パブリック静的最終文字列OP_NAME

TensorFlow コア エンジンによって認識される、この演算の名前

定数値: "DecodeWav"

パブリックメソッド

public Output < TFloat32 > audio ()

形状 `[長さ、チャネル]` の 2 次元。

public static DecodeWav create (スコープスコープ、オペランド< TString > の内容、オプション...オプション)

新しい DecodeWav 操作をラップするクラスを作成するファクトリ メソッド。

パラメーター
範囲現在のスコープ
コンテンツ通常はファイルからの WAV エンコードされたオーディオ。
オプションオプションの属性値を持ちます
戻り値
  • DecodeWav の新しいインスタンス

public static DecodeWav.OptionsdesiredChannels (長い希望チャンネル)

パラメーター
希望のチャンネル必要なサンプル チャネルの数。

public static DecodeWav.OptionsdesiredSamples (待望のSamples)

パラメーター
希望のサンプル要求された音声の長さ。

public Output <TInt32> sampleRate ()

WAV ヘッダーにあるサンプル レートを保持するスカラー。