文本分类

使用 TensorFlow Lite 模型将段落分类到预定义组中。

注:(1) 要集成现有模型,请尝试 TensorFlow Lite Task Library。(2) 要自定义模型,请尝试 TensorFlow Lite Model Maker

开始

如果您是 TensorFlow Lite 新用户,并且使用的是 Android 系统,我们建议您浏览 TensorFlow Lite Task Library 的指南,将图像分割模型集成到几行代码中。您也可以使用 TensorFlow Lite Interpreter Java API 集成模型。

Android 示例

Android 示例

如果您使用的不是 Android 平台,或者您已经熟悉 TensorFlow Lite API,则可以下载我们的起始文本分类模型。

下载入门模型

工作方式

文本分类根据内容将段落分类到预定义组中。

此预训练模型可预测段落的情感是正面的还是负面的。它在 Mass 等人提供的 Large Movie Review Dataset v1.0 上进行训练,该数据集包含标记为正面或负面的 IMDB 电影评论。

下面是使用该模型对段落进行分类的步骤:

  1. 对段落进行分词,并使用预定义词汇表将其转换为一个单词 ID 列表。
  2. 将该列表馈送到 TensorFlow Lite 模型。
  3. 从模型输出获取该段落为正面或负面评价的概率。

说明

  • 仅支持英语。
  • 此模型在电影评论数据集上进行训练,因此,对其他领域的文本进行分类时,您可能发现准确率有所降低。

性能基准

性能基准数值使用此处所述工具生成。

模型名称 模型大小 设备 CPU
文本分类 0.6 Mb Pixel 3 (Android 10) 0.05ms*
Pixel 4 (Android 10) 0.05ms*
iPhone XS (iOS 12.4.1) 0.025ms**

使用 4 个线程。

** 为了获得最佳性能结果,在 iPhone 上使用 2 个线程。

示例输出

Text Negative (0) Positive (1)
This is the best movie I’ve seen in recent 25.3% 74.7%
: years. Strongly recommend it! : : :
What a waste of my time. 72.5% 27.5%

使用训练数据集

使用您自己的数据集,按照本教程运用本文使用的相同技术训练文本分类模型。利用正确的数据集,您可以为文档分类或负面评论检测等用例创建模型。

详细了解文本分类

  • 使用 4 个线程。