StringNGrams

পাবলিক চূড়ান্ত বর্গ StringNGrams

রাগড স্ট্রিং ডেটা থেকে এনগ্রাম তৈরি করে।

এই অপটি শুধুমাত্র স্ট্রিং সমন্বিত 1 র‍্যাগড ডাইমেনশন সহ একটি র‍্যাগড টেনসর গ্রহণ করে এবং সেই স্ট্রিংটির এনগ্রাম সমন্বিত 1টি র‍্যাগড ডাইমেনশন সহ একটি র‍্যাগড টেনসর আউটপুট করে, যা সবচেয়ে ভিতরের অক্ষ বরাবর যুক্ত হয়।

পাবলিক পদ্ধতি

স্ট্যাটিক <টি নম্বর প্রসারিত> StringNGrams <টি>
তৈরি ( ব্যাপ্তি সুযোগ প্রতীক <স্ট্রিং> ডেটা, প্রতীক <টি> dataSplits, স্ট্রিং বিভাজক, তালিকা <লং> ngramWidths, স্ট্রিং leftPad, স্ট্রিং rightPad, লং padWidth, বুলিয়ান preserveShortSequences)
একটি নতুন StringNGrams অপারেশন মোড়ানো একটি ক্লাস তৈরি করার কারখানা পদ্ধতি।
আউটপুট <স্ট্রিং>
ngrams ()
আউটপুট এনগ্রামের মান টেনসর রাগড টেনসর।
আউটপুট <টি>
ngramsSplits ()
আউটপুট এনগ্রামের বিভক্ত টেনসর রাগড টেনসর।

উত্তরাধিকারসূত্রে প্রাপ্ত পদ্ধতি

পাবলিক পদ্ধতি

পাবলিক স্ট্যাটিক StringNGrams <টি> তৈরি করুন ( ব্যাপ্তি সুযোগ প্রতীক <স্ট্রিং> ডেটা, প্রতীক <টি> dataSplits, স্ট্রিং বিভাজক, তালিকা <লং> ngramWidths, স্ট্রিং leftPad, স্ট্রিং rightPad, লং padWidth, বুলিয়ান preserveShortSequences)

একটি নতুন StringNGrams অপারেশন মোড়ানো একটি ক্লাস তৈরি করার কারখানা পদ্ধতি।

পরামিতি
সুযোগ বর্তমান সুযোগ
তথ্য এনগ্রাম তৈরি করতে র্যাগড স্ট্রিং টেনসরের মান টেনসর। একটি 1D স্ট্রিং টেনসর হতে হবে।
ডেটা স্প্লিট রাগড স্ট্রিং টেনসরের স্প্লিট টেনসর এনগ্রাম তৈরি করতে।
বিভাজক টোকেনের উপাদানগুলির মধ্যে যোগ করার জন্য স্ট্রিং। কোন বিভাজকের জন্য "" ব্যবহার করুন।
ngram প্রস্থ এনগ্রামের মাপ তৈরি করতে হবে।
বামপ্যাড এনগ্রাম সিকোয়েন্সের বাম দিকে প্যাড করার জন্য ব্যবহার করা স্ট্রিং। শুধুমাত্র pad_width != 0 হলেই ব্যবহৃত হয়।
ডানপ্যাড এনগ্রাম সিকোয়েন্সের ডানদিকে প্যাড করার জন্য যে স্ট্রিংটি ব্যবহার করা হবে। শুধুমাত্র pad_width != 0 হলেই ব্যবহৃত হয়।
প্যাড প্রস্থ প্রতিটি সিকোয়েন্সের প্রতিটি পাশে যোগ করার জন্য প্যাডিং উপাদানের সংখ্যা। মনে রাখবেন যে প্যাডিং এই মান নির্বিশেষে 'ngram_widths'-1 এর চেয়ে বেশি হবে না। যদি `pad_width=-1`, তাহলে `max(ngram_widths)-1` উপাদান যোগ করুন।
রিটার্নস
  • StringNGrams এর একটি নতুন উদাহরণ

পাবলিক আউটপুট <স্ট্রিং> ngrams ()

আউটপুট এনগ্রামের মান টেনসর রাগড টেনসর।

পাবলিক আউটপুট <টি> ngramsSplits ()

আউটপুট এনগ্রামের বিভক্ত টেনসর রাগড টেনসর।