Buku Masak Teks

Halaman ini mencantumkan serangkaian panduan dan alat yang dikenal untuk memecahkan masalah dalam domain teks dengan TensorFlow Hub. Ini adalah titik awal bagi siapa saja yang ingin memecahkan masalah umum ML menggunakan komponen ML yang telah dilatih sebelumnya, bukan memulai dari awal.

Klasifikasi

Saat kita ingin memprediksi suatu kelas untuk contoh tertentu, misalnya sentimen , toksisitas , kategori artikel , atau karakteristik lainnya.

Grafik Klasifikasi Teks

Tutorial di bawah ini menyelesaikan tugas yang sama dari sudut pandang berbeda dan menggunakan alat berbeda.

keras

Klasifikasi teks dengan Keras - contoh untuk membuat pengklasifikasi sentimen IMDB dengan Kumpulan Data Keras dan TensorFlow.

Penaksir

Klasifikasi teks - contoh untuk membuat pengklasifikasi sentimen IMDB dengan Estimator. Berisi beberapa tips untuk perbaikan dan bagian perbandingan modul.

BERT

Memprediksi Sentimen Ulasan Film dengan BERT di TF Hub - menunjukkan cara menggunakan modul BERT untuk klasifikasi. Termasuk penggunaan perpustakaan bert untuk tokenisasi dan prapemrosesan.

Kaggle

Klasifikasi IMDB di Kaggle - menunjukkan cara mudah berinteraksi dengan kompetisi Kaggle dari Colab, termasuk mengunduh data dan mengirimkan hasilnya.

Penaksir keras TF2 Kumpulan Data TF BERT API Kaggle
Klasifikasi teks Selesai
Klasifikasi teks dengan Keras SelesaiSelesaiSelesai
Memprediksi Sentimen Review Film dengan BERT di TF Hub SelesaiSelesai
Klasifikasi IMDB di Kaggle SelesaiSelesai

Tugas Bangla dengan penyematan FastText

TensorFlow Hub saat ini tidak menawarkan modul dalam semua bahasa. Tutorial berikut menunjukkan cara memanfaatkan TensorFlow Hub untuk eksperimen cepat dan pengembangan ML modular.

Pengklasifikasi Artikel Bangla - mendemonstrasikan cara membuat penyematan teks TensorFlow Hub yang dapat digunakan kembali, dan menggunakannya untuk melatih pengklasifikasi Keras untuk kumpulan data Artikel BARD Bangla .

Kesamaan semantik

Saat kita ingin mengetahui kalimat mana yang berkorelasi satu sama lain dalam pengaturan zero-shot (tidak ada contoh pelatihan).

Grafik Kemiripan Semantik

Dasar

Kesamaan semantik - menunjukkan cara menggunakan modul encoder kalimat untuk menghitung kesamaan kalimat.

Lintas bahasa

Kesamaan semantik lintas bahasa - menunjukkan cara menggunakan salah satu pembuat enkode kalimat lintas bahasa untuk menghitung kesamaan kalimat antar bahasa.

Pengambilan semantik

Pengambilan semantik - menunjukkan cara menggunakan encoder kalimat Q/A untuk mengindeks kumpulan dokumen untuk pengambilan berdasarkan kesamaan semantik.

Masukan Potongan Kalimat

Kemiripan semantik dengan universal encoder lite - menunjukkan cara menggunakan modul encoder kalimat yang menerima id SentencePiece pada input, bukan teks.

Pembuatan modul

Daripada hanya menggunakan modul di tfhub.dev , ada cara untuk membuat modul sendiri. Ini bisa menjadi alat yang berguna untuk modularitas basis kode ML yang lebih baik dan untuk berbagi lebih lanjut.

Membungkus embeddings terlatih yang sudah ada

Pengekspor modul penyematan teks - alat untuk menggabungkan penyematan terlatih yang sudah ada ke dalam sebuah modul. Menunjukkan cara memasukkan operasi pra-pemrosesan teks ke dalam modul. Hal ini memungkinkan untuk membuat modul penyematan kalimat dari penyematan token.

Pengekspor modul penyematan teks v2 - sama seperti di atas, tetapi kompatibel dengan TensorFlow 2 dan eksekusi yang bersemangat.