StringNGrams

সর্বজনীন চূড়ান্ত ক্লাস স্ট্রিংএনগ্রাম

রাগড স্ট্রিং ডেটা থেকে এনগ্রাম তৈরি করে।

এই অপটি 1টি র‍্যাগড ডাইমেনশন সহ একটি র‍্যাগড টেনসর গ্রহণ করে যার মধ্যে শুধুমাত্র স্ট্রিং থাকে এবং সেই স্ট্রিংটির এনগ্রাম সমন্বিত 1টি র‍্যাগড ডাইমেনশন সহ একটি র‍্যাগড টেনসর আউটপুট করে, যা সবচেয়ে ভিতরের অক্ষ বরাবর যুক্ত হয়।

পাবলিক পদ্ধতি

static <T প্রসারিত সংখ্যা> StringNGrams <T>
তৈরি করুন ( স্কোপ স্কোপ, অপারেন্ড <স্ট্রিং> ডেটা, অপারেন্ড <টি> ডেটা স্প্লিট, স্ট্রিং বিভাজক, তালিকা<লং> এনগ্রামউইথস, স্ট্রিং লেফটপ্যাড, স্ট্রিং রাইটপ্যাড, লং প্যাডউইথ, বুলিয়ান সংরক্ষণ সংক্ষিপ্ত সিকোয়েন্স)
একটি নতুন StringNGrams অপারেশন মোড়ানো একটি ক্লাস তৈরি করার কারখানা পদ্ধতি।
আউটপুট <স্ট্রিং>
ngrams ()
আউটপুট এনগ্রামের মান টেনসর রাগড টেনসর।
আউটপুট <T>
ngramsSplits ()
আউটপুট এনগ্রামের বিভক্ত টেনসর রাগড টেনসর।

উত্তরাধিকারসূত্রে প্রাপ্ত পদ্ধতি

পাবলিক পদ্ধতি

পাবলিক স্ট্যাটিক স্ট্রিংগ্রামস <T> তৈরি করুন ( স্কোপ স্কোপ, অপারেন্ড <স্ট্রিং> ডেটা, অপারেন্ড <T> ডেটা স্প্লিট, স্ট্রিং বিভাজক, তালিকা<লং> এনগ্রামউইথ, স্ট্রিং লেফটপ্যাড, স্ট্রিং রাইটপ্যাড, লং প্যাডউইথ, বুলিয়ান সংরক্ষণ সংক্ষিপ্ত সিকোয়েন্স)

একটি নতুন StringNGrams অপারেশন মোড়ানো একটি ক্লাস তৈরি করার কারখানা পদ্ধতি।

পরামিতি
সুযোগ বর্তমান সুযোগ
তথ্য এনগ্রাম তৈরি করতে র্যাগড স্ট্রিং টেনসরের মান টেনসর। একটি 1D স্ট্রিং টেনসর হতে হবে।
ডেটা স্প্লিট রাগড স্ট্রিং টেনসরের স্প্লিট টেনসর যা থেকে এনগ্রাম তৈরি করে।
বিভাজক টোকেনের উপাদানগুলির মধ্যে যোগ করার জন্য স্ট্রিং। কোন বিভাজকের জন্য "" ব্যবহার করুন।
ngram প্রস্থ এনগ্রামের মাপ তৈরি করতে হবে।
বামপ্যাড এনগ্রাম সিকোয়েন্সের বাম দিকে প্যাড করার জন্য ব্যবহার করা স্ট্রিং। শুধুমাত্র pad_width != 0 হলেই ব্যবহৃত হয়।
ডানপ্যাড এনগ্রাম সিকোয়েন্সের ডান দিকে প্যাড করার জন্য যে স্ট্রিংটি ব্যবহার করা হবে। শুধুমাত্র pad_width != 0 হলেই ব্যবহৃত হয়।
প্যাড প্রস্থ প্রতিটি সিকোয়েন্সের প্রতিটি পাশে যোগ করার জন্য প্যাডিং উপাদানের সংখ্যা। মনে রাখবেন যে প্যাডিং এই মান নির্বিশেষে 'ngram_widths'-1 এর চেয়ে বেশি হবে না। যদি `pad_width=-1`, তাহলে `max(ngram_widths)-1` উপাদান যোগ করুন।
রিটার্নস
  • StringNGrams এর একটি নতুন উদাহরণ

সর্বজনীন আউটপুট <স্ট্রিং> এনগ্রাম ()

আউটপুট এনগ্রামের মান টেনসর রাগড টেনসর।

সর্বজনীন আউটপুট <T> ngramsSplits ()

আউটপুট এনগ্রামের বিভক্ত টেনসর রাগড টেনসর।