UnicodeEncode

کلاس نهایی عمومی UnicodeEncode

یک تانسور از ints را در رشته های یونیکد رمزگذاری کنید.

بردار رشته‌ها را برمی‌گرداند، جایی که «خروجی[i]» با رمزگذاری نقاط کد یونیکد در «مقدارهای_ورودی[شکاف_های_ورودی[i]:input_splits[i+1]]» با استفاده از «کدگذاری_خروجی» ساخته می‌شود.

---

مثال:

input_values = [72, 101, 108, 108, 111, 87, 111, 114, 108, 100]
 input_splits = [0, 5, 10]
 output_encoding = 'UTF-8'
 
 output = ['Hello', 'World']
 

کلاس های تو در تو

کلاس UnicodeEncode.Options ویژگی های اختیاری برای UnicodeEncode

ثابت ها

رشته OP_NAME نام این عملیات، همانطور که توسط موتور هسته TensorFlow شناخته می شود

روش های عمومی

خروجی < TRString >
asOutput ()
دسته نمادین تانسور را برمی‌گرداند.
UnicodeEcode ایستا
ایجاد ( دامنه دامنه ، عملوند < TINT32 > مقادیر ورودی، عملوند <؟ گسترش TNumber > inputSplits، خروجی رشته، کدگذاری رشته، گزینه‌ها... گزینه‌ها)
روش کارخانه برای ایجاد کلاسی که یک عملیات UnicodeEncode جدید را بسته بندی می کند.
استاتیک UnicodeEncode.Options
خطاها (خطاهای رشته ای)
خروجی < TRString >
خروجی ()
تانسور 1 بعدی رشته ها کدگذاری شده از نقاط کد یونیکد ارائه شده.
استاتیک UnicodeEncode.Options
جایگزینی Char (Long replacementChar)

روش های ارثی

ثابت ها

رشته نهایی ثابت عمومی OP_NAME

نام این عملیات، همانطور که توسط موتور هسته TensorFlow شناخته می شود

مقدار ثابت: "UnicodeEcode"

روش های عمومی

خروجی عمومی < TRString > asOutput ()

دسته نمادین تانسور را برمی‌گرداند.

ورودی های عملیات TensorFlow خروجی های عملیات تنسورفلو دیگر هستند. این روش برای به دست آوردن یک دسته نمادین که نشان دهنده محاسبه ورودی است استفاده می شود.

ایجاد UnicodeEncode ایستا عمومی (حوزه دامنه ، عملوند < TINT32 > مقادیر ورودی، عملوند <? گسترش TNumber > inputSplits، OutputEncoding رشته، گزینه‌ها... گزینه‌ها)

روش کارخانه برای ایجاد کلاسی که یک عملیات UnicodeEncode جدید را بسته بندی می کند.

پارامترها
دامنه محدوده فعلی
مقادیر ورودی یک تانسور 1 بعدی حاوی کدهای یونیکد که باید کدگذاری شوند.
inputSplits یک تانسور 1 بعدی که مشخص می کند چگونه نقاط کد یونیکد باید به رشته ها تقسیم شوند. به طور خاص، «خروجی[i]» با رمزگذاری نقاط کد در قطعه «input_values[input_splits[i]:input_splits[i+1]]» ساخته می‌شود.
outputEncoding رمزگذاری یونیکد رشته های خروجی. رمزگذاری‌های معتبر عبارتند از: "UTF-8"، "UTF-16-BE" و "UTF-32-BE"".
گزینه ها مقادیر ویژگی های اختیاری را حمل می کند
برمی گرداند
  • یک نمونه جدید از UnicodeEcode

خطاهای عمومی استاتیک UnicodeEncode.Options (خطاهای رشته ای)

پارامترها
خطاها خط مشی رسیدگی به خطا زمانی که قالب بندی نامعتبر در ورودی یافت می شود. مقدار 'strict' باعث می شود که عملیات خطای InvalidArgument در هر قالب بندی ورودی نامعتبر ایجاد کند. مقدار «replace» (پیش‌فرض) باعث می‌شود که عملیات هر قالب‌بندی نامعتبر در ورودی را با کد «replacement_char» جایگزین کند. مقدار "نادیده گرفتن" باعث می شود عملیات از هر قالب بندی نامعتبر در ورودی صرف نظر کند و هیچ کاراکتر خروجی مربوطه تولید نکند.

خروجی عمومی < TRString > خروجی ()

تانسور 1 بعدی رشته ها کدگذاری شده از نقاط کد یونیکد ارائه شده.

عمومی استاتیک UnicodeEncode.Options replacementChar (Long replacementChar)

پارامترها
جایگزینی Char نقطه کد کاراکتر جایگزین برای استفاده به جای هر قالب بندی نامعتبر در ورودی در هنگام `errors='replace'`. ممکن است از هر کد یونیکد معتبر استفاده شود. مقدار پیش‌فرض این است که کاراکتر جایگزین یونیکد پیش‌فرض 0xFFFD (U+65533) است.