TensorFlow テキスト処理チュートリアル

TensorFlow テキスト処理チュートリアルでは、一般的なテキストおよび自然言語処理 (NLP) の問題を解決するための段階的な手順が提供されます。

TensorFlow は、テキストおよび自然言語処理のための 2 つのソリューション、KerasNLP と TensorFlow Text を提供します。 KerasNLP は、最新の Transformer ベースのモデルと下位レベルのトークン化ユーティリティをすべて含む高レベルの NLP ライブラリです。これは、ほとんどの NLP ユースケースに推奨されるソリューションです。

下位レベルのテキスト処理ツールにアクセスする必要がある場合は、TensorFlow Text を使用できます。 TensorFlow Text は、生のテキスト文字列やドキュメントなどのテキスト形式での入力を操作するのに役立つ操作とライブラリのコレクションを提供します。

ケラスNLP

  • KerasNLP の入門: 事前トレーニングされたモデルの使用から独自の Transformer をゼロから構築するまで、段階的な複雑さのレベルで感情分析を実行することで KerasNLP を学習します。

テキストの生成

テキストの分類

  • BERT によるテキストの分類: BERT を微調整して、プレーンテキストの IMDb 映画レビューのデータセットに対して感情分析を実行します。
  • RNN を使用したテキスト分類: RNN をトレーニングして、IMDb 映画レビューの感情分析を実行します。
  • TF.Text メトリクス: TensorFlow Text を通じて利用できるメトリクスについて学びます。このライブラリには、テキスト生成モデルの自動評価に使用できる ROUGE-L などのテキスト類似性メトリクスの実装が含まれています。

BERT を使用した NLP

埋め込み