UnicodeDecode

পাবলিক চূড়ান্ত বর্গ UnicodeDecode

ইউনিকোড কোড পয়েন্টের ক্রমানুসারে `ইনপুট`-এ প্রতিটি স্ট্রিং ডিকোড করে।

সমস্ত স্ট্রিংয়ের জন্য অক্ষর কোডপয়েন্টগুলি একটি একক ভেক্টর `char_values` ব্যবহার করে ফেরত দেওয়া হয়, স্ট্রিংগুলিকে সারি-প্রধান ক্রমে অক্ষরগুলিতে প্রসারিত করা হয়।

`সারি_বিভক্ত` টেনসর নির্দেশ করে যে প্রতিটি ইনপুট স্ট্রিংয়ের কোডপয়েন্টগুলি কোথায় শুরু হয় এবং `char_values` টেনসরের মধ্যে শেষ হয়। বিশেষ করে, `i`ম স্ট্রিং (সারি-প্রধান ক্রমে) এর মানগুলি `[সারি_বিভাজন[i]:রো_বিভাজন[i+1]]` স্লাইসে সংরক্ষিত থাকে। এইভাবে:

  • `char_values[row_splits[i]+j]` হল `i`th স্ট্রিং (সারি-প্রধান ক্রমে) `j`ম অক্ষরের জন্য ইউনিকোড কোডপয়েন্ট।
  • `সারি_বিভাজন[i+1] - সারি_বিভাজন[i]` হল `i`তম স্ট্রিং-এর অক্ষরের সংখ্যা (সারি-প্রধান ক্রমে)।

নেস্টেড ক্লাস

ক্লাস UnicodeDecode.Options জন্য ঐচ্ছিক বৈশিষ্ট্য UnicodeDecode

পাবলিক পদ্ধতি

আউটপুট <integer>
charValues ()
একটি 1D int32 টেনসর যাতে ডিকোড করা কোডপয়েন্ট থাকে।
স্ট্যাটিক <টি নম্বর প্রসারিত> UnicodeDecode <টি>
তৈরি ( ব্যাপ্তি সুযোগ প্রতীক <স্ট্রিং> ইনপুট, স্ট্রিং inputEncoding ক্লাস <টি> Tsplits, বিকল্পসমূহ ... অপশন)
একটি নতুন ইউনিকোডডিকোড অপারেশন মোড়ানো একটি ক্লাস তৈরি করার কারখানা পদ্ধতি।
স্ট্যাটিক UnicodeDecode <লং>
তৈরি ( ব্যাপ্তি সুযোগ প্রতীক <স্ট্রিং> ইনপুট, স্ট্রিং inputEncoding, বিকল্পসমূহ ... অপশন)
ডিফল্ট আউটপুট প্রকারগুলি ব্যবহার করে একটি নতুন ইউনিকোডডিকোড অপারেশন মোড়ানো ক্লাস তৈরি করার কারখানা পদ্ধতি।
স্ট্যাটিক UnicodeDecode.Options
ত্রুটি (স্ট্রিং ত্রুটিগুলি দেখে)
স্ট্যাটিক UnicodeDecode.Options
replaceControlCharacters (বুলিয়ান replaceControlCharacters)
স্ট্যাটিক UnicodeDecode.Options
replacementChar (দীর্ঘ replacementChar)
আউটপুট <টি>
rowSplits ()
একটি 1D int32 টেনসর যাতে সারি বিভক্ত হয়।

উত্তরাধিকারসূত্রে প্রাপ্ত পদ্ধতি

পাবলিক পদ্ধতি

পাবলিক আউটপুট <integer> charValues ()

একটি 1D int32 টেনসর যাতে ডিকোড করা কোডপয়েন্ট থাকে।

পাবলিক স্ট্যাটিক UnicodeDecode <টি> তৈরি করুন ( ব্যাপ্তি সুযোগ প্রতীক <স্ট্রিং> ইনপুট, স্ট্রিং inputEncoding ক্লাস <টি> Tsplits, বিকল্পসমূহ ... অপশন)

একটি নতুন ইউনিকোডডিকোড অপারেশন মোড়ানো একটি ক্লাস তৈরি করার কারখানা পদ্ধতি।

পরামিতি
সুযোগ বর্তমান সুযোগ
ইনপুট পাঠ্যটি ডিকোড করতে হবে। যে কোন আকৃতি থাকতে পারে। লক্ষ্য করুন যে আউটপুট চার মানগুলির একটি ভেক্টরে সমতল করা হয়েছে।
ইনপুট এনকোডিং ইনপুট স্ট্রিং এর টেক্সট এনকোডিং। এটি ICU ucnv অ্যালগরিদমিক কনভার্টার দ্বারা সমর্থিত যেকোন এনকোডিং। উদাহরণ: `"UTF-16", "US ASCII", "UTF-8"`৷
বিকল্প ঐচ্ছিক বৈশিষ্ট্য মান বহন করে
রিটার্নস
  • ইউনিকোডডিকোডের একটি নতুন উদাহরণ

পাবলিক স্ট্যাটিক UnicodeDecode <লং> তৈরি করুন ( ব্যাপ্তি সুযোগ প্রতীক <স্ট্রিং> ইনপুট, স্ট্রিং inputEncoding, বিকল্পসমূহ ... অপশন)

ডিফল্ট আউটপুট প্রকারগুলি ব্যবহার করে একটি নতুন ইউনিকোডডিকোড অপারেশন মোড়ানো ক্লাস তৈরি করার কারখানা পদ্ধতি।

পরামিতি
সুযোগ বর্তমান সুযোগ
ইনপুট পাঠ্যটি ডিকোড করতে হবে। যে কোন আকৃতি থাকতে পারে। লক্ষ্য করুন যে আউটপুট চার মানগুলির একটি ভেক্টরে সমতল করা হয়েছে।
ইনপুট এনকোডিং ইনপুট স্ট্রিং এর টেক্সট এনকোডিং। এটি ICU ucnv অ্যালগরিদমিক কনভার্টার দ্বারা সমর্থিত যেকোন এনকোডিং। উদাহরণ: `"UTF-16", "US ASCII", "UTF-8"`৷
বিকল্প ঐচ্ছিক বৈশিষ্ট্য মান বহন করে
রিটার্নস
  • ইউনিকোডডিকোডের একটি নতুন উদাহরণ

পাবলিক স্ট্যাটিক UnicodeDecode.Options ত্রুটি (স্ট্রিং ত্রুটিগুলি দেখে)

পরামিতি
ত্রুটি ইনপুটে অবৈধ বিন্যাস পাওয়া গেলে নীতি পরিচালনার ত্রুটি৷ 'কঠোর' এর মান অপারেশনটিকে যে কোনো অবৈধ ইনপুট বিন্যাসে একটি InvalidArgument ত্রুটি তৈরি করবে। 'প্রতিস্থাপন' (ডিফল্ট) এর একটি মান অপারেশনটিকে ইনপুটে যেকোন অবৈধ বিন্যাসকে `প্রতিস্থাপন_চার` কোডপয়েন্ট দিয়ে প্রতিস্থাপন করবে। 'উপেক্ষা' এর একটি মান অপারেশনটিকে ইনপুটে কোনো অবৈধ বিন্যাস এড়িয়ে যেতে এবং কোনো সংশ্লিষ্ট আউটপুট অক্ষর তৈরি করবে না।

পাবলিক স্ট্যাটিক UnicodeDecode.Options replaceControlCharacters (বুলিয়ান replaceControlCharacters)

পরামিতি
কন্ট্রোল অক্ষর প্রতিস্থাপন করুন C0 কন্ট্রোল অক্ষর (00-1F) কে `প্রতিস্থাপন_চর` দিয়ে প্রতিস্থাপন করা হবে কিনা। ডিফল্ট মিথ্যা.

পাবলিক স্ট্যাটিক UnicodeDecode.Options replacementChar (দীর্ঘ replacementChar)

পরামিতি
প্রতিস্থাপনচর প্রতিস্থাপন অক্ষর কোডপয়েন্ট ইনপুটে কোনো অবৈধ বিন্যাসের জায়গায় ব্যবহার করা হবে যখন `errors='replace'`। যেকোনো বৈধ ইউনিকোড কোডপয়েন্ট ব্যবহার করা যেতে পারে। ডিফল্ট মান হল ডিফল্ট ইউনিকোড প্রতিস্থাপন অক্ষর হল 0xFFFD বা U+65533।)

পাবলিক আউটপুট <টি> rowSplits ()

একটি 1D int32 টেনসর যাতে সারি বিভক্ত হয়।