TensorFlow が 5 月 14 日の Google I/O に戻ってきます。今すぐ登録

このページは Cloud Translation API によって翻訳されました。

TensorAudio

パブリッククラスTensorAudio

入力オーディオサンプルを準備するためのリングバッファーといくつかのユーティリティ関数を定義します。

入力オーディオデータを保持するリングバッファーを維持します。クライアントは、「load」メソッドを介して入力オーディオデータをフィードし、「getTensorBuffer」メソッドを介して集約されたオーディオサンプルにアクセスできます。

このクラスは、Float ( AudioFormat.ENCODING_PCM_16BIT内) または Short ( AudioFormat.ENCODING_PCM_FLOAT内) の入力オーディオのみを処理できることに注意してください。内部的には、すべてのオーディオサンプルを PCM Float エンコーディングに変換して保存します。

Kotlin

   val tensor = TensorAudio.create(format, modelInputLength)
   tensor.load(newData)
   interpreter.run(tensor.getTensorBuffer(), outputBuffer);

での一般的な使用法

AudioRecord

   val tensor = TensorAudio.create(format, modelInputLength)
   Timer().scheduleAtFixedRate(delay, period) {
     tensor.load(audioRecord)
     interpreter.run(tensor.getTensorBuffer(), outputBuffer)
   }

を使用した別のサンプル使用法

ネストされたクラス

クラス TensorAudio.TensorAudioFormat 受信オーディオサンプルの形式、つまりチャネル数とサンプルレートを記述するいくつかの定数をラップします。

パブリックメソッド

静的TensorAudio	create (AudioFormat形式、intsampleCounts) サイズが`sampleCounts` * `format.getChannelCount()`のリングバッファを持つ`TensorAudio`インスタンスを作成します。
静的TensorAudio	create ( TensorAudio.TensorAudioFormat形式、 int sampleCounts) サイズが`sampleCounts` * `format.getChannels()`のリングバッファを持つ`AudioRecord`インスタンスを作成します。
TensorAudio.TensorAudioFormat	getFormat ()
テンソルバッファ	getTensorBuffer () `AudioFormat.ENCODING_PCM_FLOAT`内の利用可能なすべてのオーディオサンプルを保持する float `TensorBuffer`を返します。
空所	ロード(short[] ソース) 入力オーディオサンプル`src` ENCODING_PCM_FLOAT に変換し、リングバッファーに格納します。
空所	ロード(float[] src、int offsetInFloat、int sizeInFloat) 入力オーディオサンプル`src`リングバッファーに保存します。
空所	ロード(short[] src、int offsetInShort、int sizeInShort) 入力オーディオサンプル`src` ENCODING_PCM_FLOAT に変換し、リングバッファーに格納します。
整数	ロード(AudioRecord レコード) ノンブロッキングな方法で`AudioRecord`から最新のデータをロードします。
空所	ロード(float[] src) 入力オーディオサンプル`src`リングバッファーに保存します。

継承されたメソッド

クラスjava.lang.Objectから

ブール値	等しい(オブジェクトarg0)
最終クラス<?>	getクラス()
整数	ハッシュコード（）
最後の空白	通知する()
最後の空白	すべて通知()
弦	toString ()
最後の空白	wait (long arg0, int arg1)
最後の空白	待機(長い引数0)
最後の空白	待って（）

パブリックメソッド

public static TensorAudio create (AudioFormat 形式、intsampleCounts)

サイズがsampleCounts * format.getChannelCount()のリングバッファを持つTensorAudioインスタンスを作成します。

パラメーター

フォーマット	TFLite モデルに必要な`AudioFormat` 。チャンネル数とサンプルレートを定義します。
サンプル数	モデルに供給されるサンプルの数

public static TensorAudio create ( TensorAudio.TensorAudioFormat形式、 int sampleCounts)

サイズがsampleCounts * format.getChannels()のリングバッファを持つAudioRecordインスタンスを作成します。

パラメーター

フォーマット	このクラスにロードされるオーディオデータの予期される`TensorAudio.TensorAudioFormat` 。
サンプル数	モデルに供給されるサンプルの数

public TensorAudio.TensorAudioFormat getFormat ()

public TensorBuffer getTensorBuffer ()

AudioFormat.ENCODING_PCM_FLOAT内の使用可能なすべてのオーディオサンプルを保持する float TensorBufferを返します。つまり、値は [-1, 1] の範囲内にあります。

public voidロード(short[] src)

入力オーディオサンプルsrc ENCODING_PCM_FLOAT に変換し、リングバッファーに格納します。

パラメーター

送信元	`AudioFormat.ENCODING_PCM_16BIT`でオーディオサンプルを入力します。マルチチャネル入力の場合、配列はインターリーブされます。

パブリック voidロード(float[] src、int offsetInFloat、int sizeInFloat)

入力オーディオサンプルsrcリングバッファーに保存します。

パラメーター

送信元	`AudioFormat.ENCODING_PCM_FLOAT`にオーディオサンプルを入力します。マルチチャネル入力の場合、配列はインターリーブされます。
オフセットInFloat	`src`配列内の開始位置
サイズインフロート	コピーされる浮動小数点値の数

投げる

IllegalArgumentException	互換性のないオーディオ形式または間違った入力サイズの場合

public void load (short[] src、int offsetInShort、int sizeInShort)

入力オーディオサンプルsrc ENCODING_PCM_FLOAT に変換し、リングバッファーに格納します。

パラメーター

送信元	`AudioFormat.ENCODING_PCM_16BIT`でオーディオサンプルを入力します。マルチチャネル入力の場合、配列はインターリーブされます。
オフセット短い	src 配列内の開始位置
サイズ短め	コピーされる short 値の数

投げる

IllegalArgumentException	ソース配列をコピーできない場合

public intロード(AudioRecord レコード)

ノンブロッキングな方法でAudioRecordから最新のデータをロードします。 ENCODING_PCM_16BIT と ENCODING_PCM_FLOAT のみをサポートします。

パラメーター

記録	`AudioRecord`のインスタンス

戻り値

サイズがchannelCount * sampleCountであるキャプチャされたオーディオ値の数。 AudioRecord に新しいデータがない場合、またはエラーが発生した場合、このメソッドは 0 を返します。

投げる

IllegalArgumentException	サポートされていないオーディオエンコード形式の場合
IllegalStateException	AudioRecord からの読み取りに失敗した場合

パブリック voidロード(float[] src)

入力オーディオサンプルsrcリングバッファーに保存します。

パラメーター

送信元	`AudioFormat.ENCODING_PCM_FLOAT`にオーディオサンプルを入力します。マルチチャネル入力の場合、配列はインターリーブされます。