Skipgram

পাবলিক ফাইনাল ক্লাস স্কিপগ্রাম

একটি পাঠ্য ফাইল পার্স করে এবং উদাহরণগুলির একটি ব্যাচ তৈরি করে।

নেস্টেড ক্লাস

ক্লাস Skipgram.Options Skipgram এর জন্য ঐচ্ছিক বৈশিষ্ট্য

পাবলিক পদ্ধতি

স্ট্যাটিক স্কিপগ্রাম
তৈরি করুন ( স্কোপ স্কোপ, স্ট্রিং ফাইলের নাম, লং ব্যাচসাইজ, অপশন... বিকল্প)
একটি নতুন Skipgram অপারেশন মোড়ানো একটি ক্লাস তৈরি করার কারখানা পদ্ধতি।
আউটপুট <পূর্ণসংখ্যা>
বর্তমান যুগ ()
বর্তমান যুগের সংখ্যা।
আউটপুট <পূর্ণসংখ্যা>
উদাহরণ ()
শব্দ আইডির একটি ভেক্টর।
আউটপুট <পূর্ণসংখ্যা>
লেবেল ()
শব্দ আইডির একটি ভেক্টর।
স্ট্যাটিক Skipgram.Options
mincount (লং mincount)
স্ট্যাটিক Skipgram.Options
উপনমুনা (ভাসমান উপনমুনা)
আউটপুট <লং>
মোট ওয়ার্ডস প্রসেসড ()
এখন পর্যন্ত প্রক্রিয়াকৃত শব্দের মোট সংখ্যা।
আউটপুট <পূর্ণসংখ্যা>
vocabFreq ()
শব্দের ফ্রিকোয়েন্সি।
আউটপুট <স্ট্রিং>
ভোকাবওয়ার্ড ()
কর্পাসে শব্দের ভেক্টর।
স্ট্যাটিক Skipgram.Options
উইন্ডো সাইজ (লম্বা উইন্ডো সাইজ)
আউটপুট <লং>
wordPerEpoch ()
ডেটা ফাইলে প্রতি যুগে শব্দের সংখ্যা।

উত্তরাধিকারসূত্রে প্রাপ্ত পদ্ধতি

পাবলিক পদ্ধতি

পাবলিক স্ট্যাটিক স্কিপগ্রাম তৈরি করুন ( স্কোপ স্কোপ, স্ট্রিং ফাইলের নাম, লং ব্যাচসাইজ, বিকল্প... বিকল্প)

একটি নতুন Skipgram অপারেশন মোড়ানো একটি ক্লাস তৈরি করার কারখানা পদ্ধতি।

পরামিতি
সুযোগ বর্তমান সুযোগ
ফাইলের নাম কর্পাসের পাঠ্য ফাইলের নাম।
ব্যাচ আকার উত্পাদিত ব্যাচের আকার।
বিকল্প ঐচ্ছিক বৈশিষ্ট্য মান বহন করে
রিটার্নস
  • স্কিপগ্রামের একটি নতুন উদাহরণ

সর্বজনীন আউটপুট <পূর্ণসংখ্যা> বর্তমান ইপোচ ()

বর্তমান যুগের সংখ্যা।

সর্বজনীন আউটপুট <পূর্ণসংখ্যা> উদাহরণ ()

শব্দ আইডির একটি ভেক্টর।

সর্বজনীন আউটপুট <পূর্ণসংখ্যা> লেবেল ()

শব্দ আইডির একটি ভেক্টর।

সর্বজনীন স্ট্যাটিক Skipgram.Options mincount (লং mincount)

পরামিতি
mincount শব্দভাণ্ডারে এটি অন্তর্ভুক্ত করার জন্য সর্বনিম্ন শব্দ সংঘটনের সংখ্যা।

পাবলিক স্ট্যাটিক Skipgram.Options subsample (ফ্লোট সাবস্যাম্পল)

পরামিতি
উপনমুনা শব্দ সংঘটন জন্য থ্রেশহোল্ড. উচ্চতর ফ্রিকোয়েন্সি সহ প্রদর্শিত শব্দগুলি এলোমেলোভাবে ডাউন-স্যাম্পল করা হবে। নিষ্ক্রিয় করতে 0 এ সেট করুন।

সর্বজনীন আউটপুট <Long> totalWordsProcessed ()

এখন পর্যন্ত প্রক্রিয়াকৃত শব্দের মোট সংখ্যা।

সর্বজনীন আউটপুট <Integer> vocabFreq ()

শব্দের ফ্রিকোয়েন্সি। অ-আরোহী ক্রমে সাজানো।

সর্বজনীন আউটপুট <স্ট্রিং> ভোকাবওয়ার্ড ()

কর্পাসে শব্দের ভেক্টর।

পাবলিক স্ট্যাটিক স্কিপগ্রাম। অপশন উইন্ডো সাইজ (লং উইন্ডো সাইজ)

পরামিতি
উইন্ডো সাইজ লক্ষ্যের বাম এবং ডানে ভবিষ্যদ্বাণী করার জন্য শব্দের সংখ্যা।

সর্বজনীন আউটপুট <Long> wordsPerEpoch ()

ডেটা ফাইলে প্রতি যুগে শব্দের সংখ্যা।