此页面由 Cloud Translation API 翻译。
Switch to English

Textklassifizierung

Verwenden Sie ein vorab trainiertes Modell, um einen Absatz in vordefinierte Gruppen einzuteilen.

Loslegen

Wenn Sie TensorFlow Lite noch nicht kennen und mit Android arbeiten, empfehlen wir Ihnen , das Handbuch der TensorFLow Lite-Aufgabenbibliothek zu lesen, um Textklassifizierungsmodelle in nur wenigen Codezeilen zu integrieren. Sie können das Modell auch mit der Java-API TensorFlow Lite Interpreter integrieren.

Das folgende Android-Beispiel zeigt die Implementierung für beide Methoden als lib_task_api bzw. lib_interpreter .

Android Beispiel

Wenn Sie eine andere Plattform als Android verwenden oder bereits mit den TensorFlow Lite-APIs vertraut sind, können Sie unser Starter-Textklassifizierungsmodell herunterladen.

Startermodell herunterladen

Wie es funktioniert

Die Textklassifizierung kategorisiert einen Absatz basierend auf seinem Inhalt in vordefinierte Gruppen.

Dieses vorab trainierte Modell sagt voraus, ob die Stimmung eines Absatzes positiv oder negativ ist. Es wurde auf dem Large Movie Review Dataset v1.0 von Mass et al. Trainiert, der aus IMDB-Filmkritiken besteht, die entweder als positiv oder negativ gekennzeichnet sind.

Hier sind die Schritte zum Klassifizieren eines Absatzes mit dem Modell:

  1. Tokenisieren Sie den Absatz und konvertieren Sie ihn mithilfe eines vordefinierten Vokabulars in eine Liste von Wort-IDs.
  2. Führen Sie die Liste dem TensorFlow Lite-Modell zu.
  3. Ermitteln Sie die Wahrscheinlichkeit, dass der Absatz positiv oder negativ ist, aus den Modellausgaben.

Hinweis

  • Es wird nur Englisch unterstützt.
  • Dieses Modell wurde anhand des Datensatzes für Filmkritiken trainiert, sodass bei der Klassifizierung von Text anderer Domänen möglicherweise eine geringere Genauigkeit auftritt.

Leistungsbenchmarks

Leistungsbenchmarkzahlen werden mit dem hier beschriebenen Tool generiert.

Modellname Modellgröße Gerät Zentralprozessor
Textklassifizierung 0,6 Mb Pixel 3 (Android 10) 0,05 ms *
Pixel 4 (Android 10) 0,05 ms *
iPhone XS (iOS 12.4.1) 0,025 ms **

* 4 Threads verwendet.

** 2 Threads, die auf dem iPhone verwendet werden, um das beste Leistungsergebnis zu erzielen.

Beispielausgabe

Text Negativ (0) Positiv (1)
Dies ist der beste Film, den ich in den letzten Jahren gesehen habe. Ich kann es nur empfehlen! 25,3% 74,7%
Was für eine Zeitverschwendung. 72,5% 27,5%

Verwenden Sie Ihren Trainingsdatensatz

Befolgen Sie dieses Tutorial , um dieselbe Technik anzuwenden, die hier zum Trainieren eines Textklassifizierungsmodells unter Verwendung Ihrer eigenen Datensätze verwendet wird. Mit dem richtigen Datensatz können Sie ein Modell für Anwendungsfälle wie die Kategorisierung von Dokumenten oder die Erkennung toxischer Kommentare erstellen.

Lesen Sie mehr über die Textklassifizierung