GenerateVocabRemapping

পাবলিক ফাইনাল ক্লাস GenerateVocabRemapping

নতুন এবং পুরানো শব্দভান্ডার ফাইলগুলির একটি পথ দেওয়া, একটি রিম্যাপিং টেনসর প্রদান করে৷

দৈর্ঘ্য `num_new_vocab`, যেখানে `remapping[i]` পুরানো শব্দভান্ডারের সারি নম্বর রয়েছে যা নতুন শব্দভান্ডারের সারি `i` এর সাথে মিলে যায় (লাইন `new_vocab_offset` থেকে শুরু হয় এবং `num_new_vocab` সত্তা পর্যন্ত), অথবা `- 1` যদি নতুন শব্দভান্ডারে `i` এন্ট্রি করা হয় তাহলে পুরানো শব্দভাণ্ডারে না থাকে। পুরানো শব্দভান্ডার প্রথম `old_vocab_size` এন্ট্রিতে সীমাবদ্ধ থাকে যদি `old_vocab_size` -1 এর ডিফল্ট মান না হয়।

`num_vocab_offset` পার্টিশন ভেরিয়েবল ক্ষেত্রে ব্যবহার করতে সক্ষম করে, এবং সাধারণত পার্টিশন সংক্রান্ত তথ্য পরীক্ষা করে সেট করা উচিত। ফাইলগুলির বিন্যাসটি একটি পাঠ্য ফাইল হওয়া উচিত, প্রতিটি লাইনে শব্দভান্ডারের মধ্যে একটি একক সত্তা রয়েছে৷

উদাহরণ স্বরূপ, `new_vocab_file` এর সাথে একটি পাঠ্য ফাইল একটি একক লাইনে নিম্নলিখিত উপাদানগুলির প্রত্যেকটি রয়েছে: `[f0, f1, f2, f3]`, old_vocab_file = [f1, f0, f3], `num_new_vocab = 3, new_vocab_offset = 1`, ফেরত দেওয়া রিম্যাপিং হবে `[0, -1, 2]`।

অপটি পুরানো শব্দভান্ডারে নতুন শব্দভাণ্ডারে কতগুলি এন্ট্রি ছিল তার একটি গণনাও ফেরত দেয়, যা ওজন ম্যাট্রিক্স রিম্যাপিংয়ে আরম্ভ করার জন্য মানের সংখ্যা গণনা করতে ব্যবহৃত হয়

এই কার্যকারিতাটি TensorFlow চেকপয়েন্ট থেকে সারি শব্দভান্ডার (সাধারণত, বৈশিষ্ট্য) এবং কলামের শব্দভাণ্ডার (সাধারণত, ক্লাস) উভয়ের পুনর্ম্যাপ করতে ব্যবহার করা যেতে পারে। উল্লেখ্য যে পার্টিশনিং লজিক ডিভ-পার্টিশন ভেরিয়েবলের সাথে সম্পর্কিত সংলগ্ন শব্দভান্ডারের উপর নির্ভর করে। অধিকন্তু, অন্তর্নিহিত রিম্যাপিং একটি IndexTable ব্যবহার করে (একটি অযৌক্তিক CuckooTable এর বিপরীতে), তাই ক্লায়েন্ট কোডটি সংশ্লিষ্ট index_table_from_file() ব্যবহার করা উচিত যেমন FeatureColumn ফ্রেমওয়ার্ক করে (tf.feature_to_id( এর বিপরীতে), যা একটি CuckooTable ব্যবহার করে)।

নেস্টেড ক্লাস

ক্লাস GenerateVocabRemapping.Options GenerateVocabRemapping এর জন্য ঐচ্ছিক বৈশিষ্ট্য

ধ্রুবক

স্ট্রিং OP_NAME এই অপের নাম, টেনসরফ্লো কোর ইঞ্জিন দ্বারা পরিচিত

পাবলিক পদ্ধতি

স্ট্যাটিক GenerateVocabRemapping
তৈরি করুন ( স্কোপ স্কোপ, অপারেন্ড < TString > newVocabFile, Operand < TString > oldVocabFile, Long newVocabOffset, Long numNewVocab, অপশন... বিকল্প)
একটি নতুন GenerateVocabRemapping অপারেশন মোড়ানো একটি ক্লাস তৈরি করার কারখানার পদ্ধতি।
আউটপুট < TInt32 >
সংখ্যা বর্তমান ()
পুরানো ভোকাবে পাওয়া নতুন ভোকাব এন্ট্রির সংখ্যা।
স্ট্যাটিক GenerateVocabRemapping.Options
oldVocabSize (দীর্ঘ পুরানোVocabSize)
আউটপুট < TInt64 >
রিম্যাপিং ()
দৈর্ঘ্যের একটি টেনসর num_new_vocab যেখানে সূচী i-এর উপাদানটি পুরানো আইডির সমান যা নতুন আইডি i-তে ম্যাপ করে।

উত্তরাধিকারসূত্রে প্রাপ্ত পদ্ধতি

ধ্রুবক

সর্বজনীন স্ট্যাটিক চূড়ান্ত স্ট্রিং OP_NAME

এই অপের নাম, টেনসরফ্লো কোর ইঞ্জিন দ্বারা পরিচিত

ধ্রুবক মান: "জেনারেটVocabRemapping"

পাবলিক পদ্ধতি

পাবলিক স্ট্যাটিক জেনারেটভোকাব রিম্যাপিং তৈরি করুন ( স্কোপ স্কোপ, অপারেন্ড < TString > newVocabFile, Operand < TString > oldVocabFile, লং নিউভোকাবঅফসেট, লং numNewVocab, বিকল্প... বিকল্প)

একটি নতুন GenerateVocabRemapping অপারেশন মোড়ানো একটি ক্লাস তৈরি করার কারখানার পদ্ধতি।

পরামিতি
সুযোগ বর্তমান সুযোগ
newVocabFile নতুন ভোকাব ফাইলের পথ।
oldVocabFile পুরানো ভোকাব ফাইলের পথ।
newVocabOffset নতুন ভোকাব ফাইলে কয়টি এন্ট্রি পড়তে শুরু করতে হবে।
numNewVocab রিম্যাপ করার জন্য নতুন ভোকাব ফাইলে এন্ট্রির সংখ্যা।
বিকল্প ঐচ্ছিক বৈশিষ্ট্য মান বহন করে
রিটার্নস
  • GenerateVocabRemapping এর একটি নতুন উদাহরণ

সর্বজনীন আউটপুট < TInt32 > numPresent ()

পুরানো ভোকাবে পাওয়া নতুন ভোকাব এন্ট্রির সংখ্যা।

পাবলিক স্ট্যাটিক GenerateVocabRemapping.Options oldVocabSize (দীর্ঘ পুরানোVocabSize)

পরামিতি
পুরানো ভোকাব সাইজ বিবেচনা করার জন্য পুরানো ভোকাব ফাইলে এন্ট্রির সংখ্যা। যদি -1, পুরো পুরানো শব্দভান্ডার ব্যবহার করুন।

সর্বজনীন আউটপুট < TInt64 > রিম্যাপিং ()

দৈর্ঘ্যের একটি টেনসর num_new_vocab যেখানে সূচী i-এর উপাদানটি পুরানো আইডির সমান যা নতুন আইডি i-তে ম্যাপ করে। পুরানো শব্দভান্ডারে পাওয়া যায় না এমন কোনো নতুন আইডির জন্য এই উপাদানটি -1।