공개 최종 클래스 UnicodeEncode
int의 텐서를 유니코드 문자열로 인코딩합니다.
`output_encoding`을 사용하여 `input_values[input_splits[i]:input_splits[i+1]]`의 유니코드 코드 포인트를 인코딩하여 `output[i]`가 생성되는 문자열 벡터를 반환합니다.
---
예:
input_values = [72, 101, 108, 108, 111, 87, 111, 114, 108, 100]
input_splits = [0, 5, 10]
output_encoding = 'UTF-8'
output = ['Hello', 'World']
중첩 클래스
수업 | UnicodeEncode.옵션 | UnicodeEncode 의 선택적 속성 |
상수
끈 | OP_NAME | TensorFlow 핵심 엔진에서 알려진 이 작업의 이름 |
공개 방법
출력 < TString > | 출력 () 텐서의 기호 핸들을 반환합니다. |
정적 유니코드인코드 | |
정적 UnicodeEncode.옵션 | 오류 (문자열 오류) |
출력 < TString > | 출력 () 제공된 유니코드 코드포인트에서 인코딩된 문자열의 1D 텐서입니다. |
정적 UnicodeEncode.옵션 | replacementChar (긴 replacementChar) |
상속된 메서드
상수
공개 정적 최종 문자열 OP_NAME
TensorFlow 핵심 엔진에서 알려진 이 작업의 이름
상수 값: "UnicodeEncode"
공개 방법
공개 출력 < TString > asOutput ()
텐서의 기호 핸들을 반환합니다.
TensorFlow 작업에 대한 입력은 다른 TensorFlow 작업의 출력입니다. 이 메서드는 입력 계산을 나타내는 기호 핸들을 얻는 데 사용됩니다.
공개 정적 UnicodeEncode 생성 ( 범위 범위, 피연산자 < TInt32 > inputValues, 피연산자 <? 확장 TNumber > inputSplits, 문자열 출력Encoding, 옵션... 옵션)
새로운 UnicodeEncode 작업을 래핑하는 클래스를 생성하는 팩토리 메서드입니다.
매개변수
범위 | 현재 범위 |
---|---|
입력값 | 인코딩해야 하는 유니코드 코드 포인트를 포함하는 1D 텐서입니다. |
입력분할 | 유니코드 코드 포인트를 문자열로 분할하는 방법을 지정하는 1D 텐서입니다. 특히, `output[i]`는 `input_values[input_splits[i]:input_splits[i+1]]` 슬라이스의 코드 포인트를 인코딩하여 구성됩니다. |
출력인코딩 | 출력 문자열의 유니코드 인코딩. 유효한 인코딩은 `"UTF-8", "UTF-16-BE" 및 "UTF-32-BE"`입니다. |
옵션 | 선택적 속성 값을 전달합니다. |
보고
- UnicodeEncode의 새 인스턴스
공개 정적 UnicodeEncode.Options 오류 (문자열 오류)
매개변수
오류 | 입력에 잘못된 형식이 있는 경우 오류 처리 정책입니다. 'strict' 값을 사용하면 잘못된 입력 형식에 대해 작업에서 InvalidArgument 오류가 생성됩니다. 'replace' 값(기본값)을 사용하면 입력의 잘못된 형식을 `replacement_char` 코드 포인트로 바꾸는 작업이 수행됩니다. 'ignore' 값을 사용하면 작업이 입력에서 잘못된 형식을 건너뛰고 해당 출력 문자가 생성되지 않습니다. |
---|
공개 정적 UnicodeEncode.Options replacementChar (Long replacementChar)
매개변수
교체문자 | `errors='replace'`일 때 입력의 유효하지 않은 형식화 대신 사용할 대체 문자 코드포인트입니다. 유효한 유니코드 코드 포인트를 사용할 수 있습니다. 기본값은 기본 유니코드 대체 문자가 0xFFFD(U+65533)입니다. |
---|