এই পৃষ্ঠাটি TensorFlow Hub-এর সাথে টেক্সট ডোমেনে সমস্যা সমাধানের জন্য পরিচিত গাইড এবং টুলের একটি সেট তালিকাভুক্ত করে। এটি এমন যেকোন ব্যক্তির জন্য একটি সূচনা স্থান যা স্ক্র্যাচ থেকে শুরু করার পরিবর্তে প্রাক-প্রশিক্ষিত ML উপাদানগুলি ব্যবহার করে সাধারণ ML সমস্যাগুলি সমাধান করতে চায়৷
শ্রেণীবিভাগ
আমরা উদাহরণ অনুভূতি, বিষাক্ততার, নিবন্ধ বিভাগ, বা অন্য কোন চরিত্রগত জন্য, একটি প্রদত্ত উদাহরণস্বরূপ একটি বর্গ ভবিষ্যদ্বাণী করা চান, তখন।
নীচের টিউটোরিয়ালগুলি বিভিন্ন দৃষ্টিকোণ থেকে এবং বিভিন্ন সরঞ্জাম ব্যবহার করে একই কাজ সমাধান করছে।
কেরাস
Keras সঙ্গে টেক্সট শ্রেণীবিন্যাস - Keras এবং TensorFlow ডেটাসেটস সঙ্গে একটি IMDB, অনুভূতি ক্লাসিফায়ার নির্মাণের জন্য উদাহরণ।
অনুমানকারী
পাঠ্য শ্রেণীবিন্যাস - মূল্নির্ধারক সঙ্গে একটি IMDB, অনুভূতি ক্লাসিফায়ার নির্মাণের জন্য উদাহরণ। উন্নতির জন্য একাধিক টিপস এবং একটি মডিউল তুলনা বিভাগ রয়েছে৷
BERT
মেমরি হাব উপর বার্ট সঙ্গে প্রেডিক্টিং চলচ্চিত্র নিরীক্ষণ ভাবপ্রবণতা - দেখায় কিভাবে শ্রেণীবিভাগ জন্য একটি বার্ট মডিউল ব্যবহার করতে। ব্যবহারের সহ bert
tokenization এবং প্রাক-প্রক্রিয়াকরণ জন্য লাইব্রেরী।
কাগল
Kaggle উপর IMDB, শ্রেণীবিন্যাস - দেখায় কিভাবে সহজে একটি Colab থেকে একটি Kaggle প্রতিযোগিতা, ডেটা ডাউনলোড এবং ফলাফল জমা দেওয়ার সহ এটির সাথে ইন্টারঅ্যাক্ট করতে।
অনুমানকারী | কেরাস | TF2 | TF ডেটাসেট | BERT | Kaggle APIs | |
---|---|---|---|---|---|---|
পাঠ্য শ্রেণিবিন্যাস | ![]() | |||||
কেরাসের সাথে পাঠ্য শ্রেণিবিন্যাস | ![]() | ![]() | ![]() | |||
TF হাব-এ BERT-এর সাথে মুভি রিভিউ সেন্টিমেন্টের পূর্বাভাস | ![]() | ![]() | ||||
Kaggle উপর IMDB শ্রেণীবিভাগ | ![]() | ![]() |
ফাস্টটেক্সট এম্বেডিংয়ের সাথে বাংলা কাজ
TensorFlow Hub বর্তমানে প্রতিটি ভাষায় একটি মডিউল অফার করে না। নিচের টিউটোরিয়ালটি দেখায় কিভাবে দ্রুত পরীক্ষা-নিরীক্ষা এবং মডুলার এমএল ডেভেলপমেন্টের জন্য টেনসরফ্লো হাব ব্যবহার করতে হয়।
বাংলা আর্টিকেল ক্লাসিফায়ার - একটি পুনর্ব্যবহারযোগ্য TensorFlow হাব টেক্সট এমবেডিং তৈরি করার পদ্ধতি, এবং এটি ব্যবহারের জন্য একটি Keras ক্লাসিফায়ার প্রশিক্ষণের প্রমান বার্ড বাংলা আর্টিকেল ডেটা সেটটি ।
শব্দার্থিক মিল
যখন আমরা শূন্য-শট সেটআপে কোন বাক্যগুলি একে অপরের সাথে সম্পর্কযুক্ত তা খুঁজে বের করতে চাই (কোন প্রশিক্ষণের উদাহরণ নেই)।
মৌলিক
শব্দার্থিক আদল - দেখায় কিভাবে বাক্য আদল গনা বাক্য এনকোডার মডিউল ব্যবহার করতে।
আন্তঃভাষিক
ক্রস-ভাষাগত শব্দার্থিক আদল - দেখায় কিভাবে ভাষাতে কম্পিউট বাক্য আদল থেকে ক্রস ভাষাগত বাক্য এনকোডার এক ব্যবহার করতে।
শব্দার্থিক পুনরুদ্ধার
শব্দার্থিক আহরণ - দেখায় কিভাবে প্রশ্ন / শব্দার্থিক সাদৃশ্যের উপর ভিত্তি করে আহরণ জন্য কাগজপত্র একটি সংকলন সূচক একটি বাক্য এনকোডার ব্যবহার করতে।
সেন্টেন্সপিস ইনপুট
সার্বজনীন এনকোডার Lite সঙ্গে শব্দার্থিক আদল - দেখায় কিভাবে বাক্য এনকোডার মডিউল যা গ্রহণ ব্যবহার করতে SentencePiece পরিবর্তে ইনপুট টেক্সট উপর আইডি।
মডিউল তৈরি
এর পরিবর্তে শুধুমাত্র মডিউল ব্যবহার করে hub.tensorflow.google.cn , সেখানে নিজের মডিউল তৈরি করতে উপায় আছে। এটি আরও ভাল ML কোডবেস মডুলারিটি এবং আরও ভাগ করার জন্য একটি দরকারী টুল হতে পারে।
বিদ্যমান প্রাক-প্রশিক্ষিত এমবেডিংগুলি মোড়ানো
পাঠ্য এম্বেডিং মডিউল রপ্তানিকারক - মোড়ানো একটি বিদ্যমান প্রাক প্রশিক্ষিত একটি মডিউল মধ্যে এম্বেডিং একটি হাতিয়ার। মডিউলে টেক্সট প্রাক-প্রসেসিং অপ্স কিভাবে অন্তর্ভুক্ত করতে হয় তা দেখায়। এটি টোকেন এম্বেডিং থেকে একটি বাক্য এমবেডিং মডিউল তৈরি করতে দেয়।
পাঠ্য এম্বেডিং মডিউল রপ্তানিকারক v2 - উপরে হিসাবে একই, কিন্তু TensorFlow 2 এবং উৎসুক সঞ্চালনের সঙ্গে সামঞ্জস্যপূর্ণ।