Sách dạy nấu ăn

Trang này liệt kê một tập hợp các hướng dẫn và công cụ đã biết giải quyết các vấn đề trong miền văn bản với TensorFlow Hub. Đây là nơi khởi đầu cho bất kỳ ai muốn giải quyết các vấn đề ML điển hình bằng cách sử dụng các thành phần ML được đào tạo trước thay vì bắt đầu từ đầu.

Phân loại

Khi chúng ta muốn dự đoán một lớp học cho một ví dụ được đưa ra, ví dụ như tình cảm, độc tính, chủng loại vật phẩm, hay bất cứ đặc điểm khác.

Đồ họa phân loại văn bản

Các hướng dẫn dưới đây giải quyết cùng một nhiệm vụ từ các góc độ khác nhau và sử dụng các công cụ khác nhau.

Keras

Phân loại văn bản với Keras - ví dụ cho việc xây dựng một niềm tin phân loại IMDB với Keras và TensorFlow Datasets.

Công cụ ước tính

Phân loại văn bản - ví dụ cho việc xây dựng một niềm tin phân loại IMDB với Estimator. Chứa nhiều mẹo để cải thiện và một phần so sánh mô-đun.

BERT

Dự đoán Movie Review Niềm tin với Bert trên TF Hub - chương trình làm thế nào để sử dụng một mô-đun Bert để phân loại. Bao gồm sử dụng bert thư viện cho tokenization và tiền xử lý.

Kaggle

Phân loại IMDB trên Kaggle - chương trình như thế nào để dễ dàng tương tác với một cuộc thi Kaggle từ một Colab, bao gồm tải dữ liệu và gửi kết quả.

Công cụ ước tính Keras TF2 Tập dữ liệu TF BERT API Kaggle
Phân loại văn bản làm xong
Phân loại văn bản với Keras làm xonglàm xonglàm xong
Dự đoán cảm xúc đánh giá phim với BERT trên TF Hub làm xonglàm xong
Phân loại IMDB trên Kaggle làm xonglàm xong

Tác vụ Bangla với nhúng FastText

TensorFlow Hub hiện không cung cấp mô-đun ở mọi ngôn ngữ. Hướng dẫn sau đây cho thấy cách tận dụng TensorFlow Hub để thử nghiệm nhanh và phát triển ML mô-đun.

Bangla Điều Classifier - chứng minh làm thế nào để tạo ra một TensorFlow Hub nhúng văn bản tái sử dụng, và sử dụng nó để đào tạo một phân loại Keras cho NHNN & PTNT Bangla Điều bộ dữ liệu .

Sự tương đồng về ngữ nghĩa

Khi chúng ta muốn tìm hiểu những câu nào tương quan với nhau trong thiết lập zero-shot (không có ví dụ đào tạo).

Đồ họa tương đồng về ngữ nghĩa

Nền tảng

Tương đồng ngữ nghĩa - chương trình làm thế nào để sử dụng các mô-đun câu encoder để tính toán câu tương tự.

Đa ngôn ngữ

Cross-ngôn ngữ ngữ nghĩa tương đồng - chương trình làm thế nào để sử dụng một trong các bộ mã hóa câu chéo ngôn ngữ để tính toán câu tương tự qua ngôn ngữ.

Truy xuất ngữ nghĩa

Semantic hồi - chương trình làm thế nào để sử dụng Q / A encoder câu để chỉ một tập hợp các tài liệu phục hồi dựa trên sự tương đồng ngữ nghĩa.

Đầu vào câu đối

Tương đồng ngữ nghĩa với Lite encoder phổ quát - chương trình làm thế nào để sử dụng module câu encoder mà chấp nhận SentencePiece id trên đầu vào thay vì văn bản.

Tạo mô-đun

Thay vì sử dụng chỉ mô-đun trên hub.tensorflow.google.cn , có nhiều cách để tạo thêm các module riêng. Đây có thể là một công cụ hữu ích để mô-đun codebase ML tốt hơn và để chia sẻ thêm.

Bao bọc các nhúng được đào tạo trước hiện có

Văn bản xuất khẩu nhúng mô-đun - một công cụ để quấn một tồn tại từ trước huấn luyện nhúng vào một mô-đun. Cho biết cách đưa các hoạt động tiền xử lý văn bản vào mô-đun. Điều này cho phép tạo mô-đun nhúng câu từ nhúng mã thông báo.

Văn bản nhúng mô-đun xuất khẩu v2 - tương tự như trên, nhưng tương thích với TensorFlow 2 và thực hiện háo hức.