ইউনিকোড কোড পয়েন্টের ক্রমানুসারে `ইনপুট`-এ প্রতিটি স্ট্রিং ডিকোড করে।
সমস্ত স্ট্রিংয়ের জন্য অক্ষর কোডপয়েন্টগুলি একটি একক ভেক্টর `char_values` ব্যবহার করে ফেরত দেওয়া হয়, স্ট্রিংগুলিকে সারি-প্রধান ক্রমে অক্ষরগুলিতে প্রসারিত করা হয়।
`সারি_বিভক্ত` টেনসর নির্দেশ করে যে প্রতিটি ইনপুট স্ট্রিংয়ের কোডপয়েন্টগুলি কোথায় শুরু হয় এবং `char_values` টেনসরের মধ্যে শেষ হয়। বিশেষ করে, `i`ম স্ট্রিং (সারি-প্রধান ক্রমে) এর মানগুলি `[সারি_বিভাজন[i]:রো_বিভাজন[i+1]]` স্লাইসে সংরক্ষিত থাকে। এইভাবে:
- `char_values[row_splits[i]+j]` হল `i`th স্ট্রিং (সারি-প্রধান ক্রমে) `j`ম অক্ষরের জন্য ইউনিকোড কোডপয়েন্ট।
- `সারি_বিভাজন[i+1] - সারি_বিভাজন[i]` হল `i`তম স্ট্রিং-এর অক্ষরের সংখ্যা (সারি-প্রধান ক্রমে)।
নেস্টেড ক্লাস
ক্লাস | UnicodeDecode.Options | জন্য ঐচ্ছিক বৈশিষ্ট্য UnicodeDecode |
পাবলিক পদ্ধতি
আউটপুট <integer> | charValues () একটি 1D int32 টেনসর যাতে ডিকোড করা কোডপয়েন্ট থাকে। |
স্ট্যাটিক <টি নম্বর প্রসারিত> UnicodeDecode <টি> | তৈরি ( ব্যাপ্তি সুযোগ প্রতীক <স্ট্রিং> ইনপুট, স্ট্রিং inputEncoding ক্লাস <টি> Tsplits, বিকল্পসমূহ ... অপশন) একটি নতুন ইউনিকোডডিকোড অপারেশন মোড়ানো একটি ক্লাস তৈরি করার কারখানা পদ্ধতি। |
স্ট্যাটিক UnicodeDecode <লং> | তৈরি ( ব্যাপ্তি সুযোগ প্রতীক <স্ট্রিং> ইনপুট, স্ট্রিং inputEncoding, বিকল্পসমূহ ... অপশন) ডিফল্ট আউটপুট প্রকারগুলি ব্যবহার করে একটি নতুন ইউনিকোডডিকোড অপারেশন মোড়ানো ক্লাস তৈরি করার কারখানা পদ্ধতি। |
স্ট্যাটিক UnicodeDecode.Options | ত্রুটি (স্ট্রিং ত্রুটিগুলি দেখে) |
স্ট্যাটিক UnicodeDecode.Options | replaceControlCharacters (বুলিয়ান replaceControlCharacters) |
স্ট্যাটিক UnicodeDecode.Options | replacementChar (দীর্ঘ replacementChar) |
আউটপুট <টি> | rowSplits () একটি 1D int32 টেনসর যাতে সারি বিভক্ত হয়। |
উত্তরাধিকারসূত্রে প্রাপ্ত পদ্ধতি
পাবলিক পদ্ধতি
পাবলিক স্ট্যাটিক UnicodeDecode <টি> তৈরি করুন ( ব্যাপ্তি সুযোগ প্রতীক <স্ট্রিং> ইনপুট, স্ট্রিং inputEncoding ক্লাস <টি> Tsplits, বিকল্পসমূহ ... অপশন)
একটি নতুন ইউনিকোডডিকোড অপারেশন মোড়ানো একটি ক্লাস তৈরি করার কারখানা পদ্ধতি।
পরামিতি
সুযোগ | বর্তমান সুযোগ |
---|---|
ইনপুট | পাঠ্যটি ডিকোড করতে হবে। যে কোন আকৃতি থাকতে পারে। লক্ষ্য করুন যে আউটপুট চার মানগুলির একটি ভেক্টরে সমতল করা হয়েছে। |
ইনপুট এনকোডিং | ইনপুট স্ট্রিং এর টেক্সট এনকোডিং। এটি ICU ucnv অ্যালগরিদমিক কনভার্টার দ্বারা সমর্থিত যেকোন এনকোডিং। উদাহরণ: `"UTF-16", "US ASCII", "UTF-8"`৷ |
বিকল্প | ঐচ্ছিক বৈশিষ্ট্য মান বহন করে |
রিটার্নস
- ইউনিকোডডিকোডের একটি নতুন উদাহরণ
পাবলিক স্ট্যাটিক UnicodeDecode <লং> তৈরি করুন ( ব্যাপ্তি সুযোগ প্রতীক <স্ট্রিং> ইনপুট, স্ট্রিং inputEncoding, বিকল্পসমূহ ... অপশন)
ডিফল্ট আউটপুট প্রকারগুলি ব্যবহার করে একটি নতুন ইউনিকোডডিকোড অপারেশন মোড়ানো ক্লাস তৈরি করার কারখানা পদ্ধতি।
পরামিতি
সুযোগ | বর্তমান সুযোগ |
---|---|
ইনপুট | পাঠ্যটি ডিকোড করতে হবে। যে কোন আকৃতি থাকতে পারে। লক্ষ্য করুন যে আউটপুট চার মানগুলির একটি ভেক্টরে সমতল করা হয়েছে। |
ইনপুট এনকোডিং | ইনপুট স্ট্রিং এর টেক্সট এনকোডিং। এটি ICU ucnv অ্যালগরিদমিক কনভার্টার দ্বারা সমর্থিত যেকোন এনকোডিং। উদাহরণ: `"UTF-16", "US ASCII", "UTF-8"`৷ |
বিকল্প | ঐচ্ছিক বৈশিষ্ট্য মান বহন করে |
রিটার্নস
- ইউনিকোডডিকোডের একটি নতুন উদাহরণ
পাবলিক স্ট্যাটিক UnicodeDecode.Options ত্রুটি (স্ট্রিং ত্রুটিগুলি দেখে)
পরামিতি
ত্রুটি | ইনপুটে অবৈধ বিন্যাস পাওয়া গেলে নীতি পরিচালনার ত্রুটি৷ 'কঠোর' এর মান অপারেশনটিকে যে কোনো অবৈধ ইনপুট বিন্যাসে একটি InvalidArgument ত্রুটি তৈরি করবে। 'প্রতিস্থাপন' (ডিফল্ট) এর একটি মান অপারেশনটিকে ইনপুটে যেকোন অবৈধ বিন্যাসকে `প্রতিস্থাপন_চার` কোডপয়েন্ট দিয়ে প্রতিস্থাপন করবে। 'উপেক্ষা' এর একটি মান অপারেশনটিকে ইনপুটে কোনো অবৈধ বিন্যাস এড়িয়ে যেতে এবং কোনো সংশ্লিষ্ট আউটপুট অক্ষর তৈরি করবে না। |
---|
পাবলিক স্ট্যাটিক UnicodeDecode.Options replaceControlCharacters (বুলিয়ান replaceControlCharacters)
পরামিতি
কন্ট্রোল অক্ষর প্রতিস্থাপন করুন | C0 কন্ট্রোল অক্ষর (00-1F) কে `প্রতিস্থাপন_চর` দিয়ে প্রতিস্থাপন করা হবে কিনা। ডিফল্ট মিথ্যা. |
---|
পাবলিক স্ট্যাটিক UnicodeDecode.Options replacementChar (দীর্ঘ replacementChar)
পরামিতি
প্রতিস্থাপনচর | প্রতিস্থাপন অক্ষর কোডপয়েন্ট ইনপুটে কোনো অবৈধ বিন্যাসের জায়গায় ব্যবহার করা হবে যখন `errors='replace'`। যেকোনো বৈধ ইউনিকোড কোডপয়েন্ট ব্যবহার করা যেতে পারে। ডিফল্ট মান হল ডিফল্ট ইউনিকোড প্রতিস্থাপন অক্ষর হল 0xFFFD বা U+65533।) |
---|