Use um modelo do TensorFlow Lite para categorizar um parágrafo em grupos predefinidos.
iniciar
Se você é novo no TensorFlow Lite e está trabalhando com Android, recomendamos explorar o guia da biblioteca de tarefas do TensorFLow Lite para integrar modelos de classificação de texto em apenas algumas linhas de código. Você também pode integrar o modelo usando a API Java do interpretador do TensorFlow Lite .
O exemplo Android abaixo demonstra a implementação de ambos os métodos lib_task_api e lib_interpreter , respectivamente.
Se você estiver usando uma plataforma diferente do Android ou já estiver familiarizado com as APIs do TensorFlow Lite, poderá fazer download do nosso modelo inicial de classificação de texto.
Como funciona
A classificação de texto categoriza um parágrafo em grupos predefinidos com base em seu conteúdo.
Este modelo pré-treinado prevê se o sentimento de um parágrafo é positivo ou negativo. Ele foi treinado no Large Movie Review Dataset v1.0 de Mass et al, que consiste em resenhas de filmes do IMDB rotuladas como positivas ou negativas.
Aqui estão as etapas para classificar um parágrafo com o modelo:
- Tokenize o parágrafo e converta-o em uma lista de IDs de palavras usando um vocabulário predefinido.
- Alimente a lista ao modelo TensorFlow Lite.
- Obtenha a probabilidade de o parágrafo ser positivo ou negativo a partir dos resultados do modelo.
Observação
- Apenas o inglês é suportado.
- Este modelo foi treinado em um conjunto de dados de resenhas de filmes para que você possa ter precisão reduzida ao classificar textos de outros domínios.
Referências de desempenho
Os números de benchmark de desempenho são gerados com a ferramenta descrita aqui .
Nome do modelo | Tamanho do modelo | Dispositivo | CPU |
---|---|---|---|
Classificação de texto | 0,6 MB | Pixel 3 (Android 10) | 0,05ms* |
Pixel 4 (Android 10) | 0,05ms* | ||
iPhone XS (iOS 12.4.1) | 0,025ms** |
* 4 fios usados.
** 2 threads usados no iPhone para melhor resultado de desempenho.
Exemplo de saída
Texto | Negativo (0) | Positivo (1) |
---|---|---|
Este é o melhor filme que vi nos últimos anos. Recomendo vivamente! | 25,3% | 74,7% |
Que desperdício do meu tempo. | 72,5% | 27,5% |
Use seu conjunto de dados de treinamento
Siga este tutorial para aplicar a mesma técnica usada aqui para treinar um modelo de classificação de texto usando seus próprios conjuntos de dados. Com o conjunto de dados certo, você pode criar um modelo para casos de uso como categorização de documentos ou detecção de comentários tóxicos.