Classement du texte

Utilisez un modèle TensorFlow Lite pour classer un paragraphe dans des groupes prédéfinis.

Commencer

Si vous débutez avec TensorFlow Lite et que vous travaillez avec Android, nous vous recommandons d'explorer le guide de la bibliothèque de tâches TensorFlow Lite pour intégrer des modèles de classification de texte en quelques lignes de code seulement. Vous pouvez également intégrer le modèle à l'aide de l' API Java TensorFlow Lite Interpreter .

L'exemple Android ci-dessous illustre l'implémentation des deux méthodes en tant que lib_task_api et lib_interpreter , respectivement.

Exemple Android

Si vous utilisez une plate-forme autre qu'Android ou si vous connaissez déjà les API TensorFlow Lite, vous pouvez télécharger notre modèle de classification de texte de démarrage.

Télécharger le modèle de démarrage

Comment ça fonctionne

La classification de texte catégorise un paragraphe en groupes prédéfinis en fonction de son contenu.

Ce modèle pré-entraîné prédit si le sentiment d'un paragraphe est positif ou négatif. Il a été formé sur Large Movie Review Dataset v1.0 de Mass et al, qui se compose de critiques de films IMDB étiquetées comme positives ou négatives.

Voici les étapes pour classer un paragraphe avec le modèle :

  1. Tokénisez le paragraphe et convertissez-le en une liste d'identifiants de mots à l'aide d'un vocabulaire prédéfini.
  2. Envoyez la liste au modèle TensorFlow Lite.
  3. Obtenez la probabilité que le paragraphe soit positif ou négatif à partir des sorties du modèle.

Noter

  • Seul l'anglais est pris en charge.
  • Ce modèle a été formé sur un ensemble de données de critiques de films, de sorte que vous pouvez rencontrer une précision réduite lors de la classification de texte d'autres domaines.

Références de performances

Les numéros de référence de performance sont générés avec l'outil décrit ici .

Nom du modèle Taille du modèle Dispositif CPU
Classement du texte 0,6 Mo Pixel 3 (Android 10) 0,05 ms*
Pixel 4 (Android 10) 0,05 ms*
iPhone XS (iOS 12.4.1) 0,025 ms**

* 4 fils utilisés.

** 2 fils utilisés sur iPhone pour le meilleur résultat de performance.

Exemple de sortie

Texte Négatif (0) Positif (1)
C'est le meilleur film que j'ai vu ces dernières années. Je le recommande vivement ! 25,3 % 74,7 %
Quelle perte de temps. 72,5 % 27,5 %

Utiliser votre jeu de données d'entraînement

Suivez ce didacticiel pour appliquer la même technique que celle utilisée ici pour former un modèle de classification de texte à l'aide de vos propres jeux de données. Avec le bon ensemble de données, vous pouvez créer un modèle pour des cas d'utilisation tels que la catégorisation de documents ou la détection de commentaires toxiques.

En savoir plus sur la classification de texte