یک تانسور از ints را در رشته های یونیکد رمزگذاری کنید.
بردار رشتهها را برمیگرداند، جایی که «خروجی[i]» با رمزگذاری نقاط کد یونیکد در «مقدارهای_ورودی[شکاف_های_ورودی[i]:input_splits[i+1]]» با استفاده از «کدگذاری_خروجی» ساخته میشود.
---
مثال:
input_values = [72, 101, 108, 108, 111, 87, 111, 114, 108, 100]
input_splits = [0, 5, 10]
output_encoding = 'UTF-8'
output = ['Hello', 'World']
کلاس های تو در تو
کلاس | UnicodeEncode.Options | ویژگی های اختیاری برای UnicodeEncode |
ثابت ها
رشته | OP_NAME | نام این عملیات، همانطور که توسط موتور هسته TensorFlow شناخته می شود |
روش های عمومی
خروجی < TRString > | asOutput () دسته نمادین تانسور را برمیگرداند. |
UnicodeEcode ایستا | |
استاتیک UnicodeEncode.Options | خطاها (خطاهای رشته ای) |
خروجی < TRString > | خروجی () تانسور 1 بعدی رشته ها کدگذاری شده از نقاط کد یونیکد ارائه شده. |
استاتیک UnicodeEncode.Options | جایگزینی Char (Long replacementChar) |
روش های ارثی
ثابت ها
رشته نهایی ثابت عمومی OP_NAME
نام این عملیات، همانطور که توسط موتور هسته TensorFlow شناخته می شود
روش های عمومی
خروجی عمومی < TRString > asOutput ()
دسته نمادین تانسور را برمیگرداند.
ورودی های عملیات TensorFlow خروجی های عملیات تنسورفلو دیگر هستند. این روش برای به دست آوردن یک دسته نمادین که نشان دهنده محاسبه ورودی است استفاده می شود.
ایجاد UnicodeEncode ایستا عمومی (حوزه دامنه ، عملوند < TINT32 > مقادیر ورودی، عملوند <? گسترش TNumber > inputSplits، OutputEncoding رشته، گزینهها... گزینهها)
روش کارخانه برای ایجاد کلاسی که یک عملیات UnicodeEncode جدید را بسته بندی می کند.
پارامترها
دامنه | محدوده فعلی |
---|---|
مقادیر ورودی | یک تانسور 1 بعدی حاوی کدهای یونیکد که باید کدگذاری شوند. |
inputSplits | یک تانسور 1 بعدی که مشخص می کند چگونه نقاط کد یونیکد باید به رشته ها تقسیم شوند. به طور خاص، «خروجی[i]» با رمزگذاری نقاط کد در قطعه «input_values[input_splits[i]:input_splits[i+1]]» ساخته میشود. |
outputEncoding | رمزگذاری یونیکد رشته های خروجی. رمزگذاریهای معتبر عبارتند از: "UTF-8"، "UTF-16-BE" و "UTF-32-BE"". |
گزینه ها | مقادیر ویژگی های اختیاری را حمل می کند |
برمی گرداند
- یک نمونه جدید از UnicodeEcode
خطاهای عمومی استاتیک UnicodeEncode.Options (خطاهای رشته ای)
پارامترها
خطاها | خط مشی رسیدگی به خطا زمانی که قالب بندی نامعتبر در ورودی یافت می شود. مقدار 'strict' باعث می شود که عملیات خطای InvalidArgument در هر قالب بندی ورودی نامعتبر ایجاد کند. مقدار «replace» (پیشفرض) باعث میشود که عملیات هر قالببندی نامعتبر در ورودی را با کد «replacement_char» جایگزین کند. مقدار "نادیده گرفتن" باعث می شود عملیات از هر قالب بندی نامعتبر در ورودی صرف نظر کند و هیچ کاراکتر خروجی مربوطه تولید نکند. |
---|
عمومی استاتیک UnicodeEncode.Options replacementChar (Long replacementChar)
پارامترها
جایگزینی Char | نقطه کد کاراکتر جایگزین برای استفاده به جای هر قالب بندی نامعتبر در ورودی در هنگام `errors='replace'`. ممکن است از هر کد یونیکد معتبر استفاده شود. مقدار پیشفرض این است که کاراکتر جایگزین یونیکد پیشفرض 0xFFFD (U+65533) است. |
---|