공개 최종 수업 LearnedUnigramCandidateSampler
학습된 유니그램 분포를 사용하여 후보 샘플링에 대한 레이블을 생성합니다.
go/candidate-sampling에서 후보 샘플링 및 데이터 형식에 대한 설명을 확인하세요.
각 배치에 대해 이 작업은 샘플링된 후보 라벨의 단일 세트를 선택합니다.
배치당 후보 샘플링의 장점은 단순성과 효율적인 조밀 행렬 곱셈의 가능성입니다. 단점은 샘플링된 후보를 컨텍스트 및 실제 레이블과 독립적으로 선택해야 한다는 것입니다.
중첩 클래스
수업 | LearnedUnigramCandidateSampler.Options | LearnedUnigramCandidateSampler 의 선택적 속성 |
상수
끈 | OP_NAME | TensorFlow 코어 엔진에서 알려진 이 작업의 이름 |
공개 방법
정적 LearnedUnigramCandidateSampler | |
출력 <TInt64> | 샘플링된 후보 () 각 요소가 샘플링된 후보의 ID인 길이 num_sampled의 벡터입니다. |
출력 < TFloat32 > | 샘플링예상횟수 () 각 샘플링된 후보에 대해 길이가 num_sampled인 벡터는 샘플링된 후보 배치에서 후보가 발생할 것으로 예상되는 횟수를 나타냅니다. |
정적 LearnedUnigramCandidateSampler.Options | 종자 (긴 종자) |
정적 LearnedUnigramCandidateSampler.Options | 시드2 (긴 시드2) |
출력 < TFloat32 > | trueExpectedCount () 배치_크기 * num_true 행렬은 샘플링된 후보 배치에서 각 후보가 발생할 것으로 예상되는 횟수를 나타냅니다. |
상속된 메서드
상수
공개 정적 최종 문자열 OP_NAME
TensorFlow 코어 엔진에서 알려진 이 작업의 이름
상수 값: "LearnedUnigramCandidateSampler"
공개 방법
공개 정적 LearnedUnigramCandidateSampler 생성 ( 범위 범위, 피연산자 < TInt64 > trueClasses, Long numTrue, Long numSampled, Boolean 고유, Long rangeMax, 옵션... 옵션)
새로운 LearnedUnigramCandidateSampler 작업을 래핑하는 클래스를 생성하는 팩토리 메서드입니다.
매개변수
범위 | 현재 범위 |
---|---|
trueClass | 각 행에 해당 원본 레이블의 num_true target_classes ID가 포함되어 있는 Batch_size * num_true 행렬. |
numTrue | 컨텍스트당 실제 레이블 수입니다. |
샘플링된 수 | 무작위로 샘플링할 후보자 수입니다. |
고유한 | Unique가 true인 경우 거부를 통해 샘플링하므로 배치의 모든 샘플링된 후보가 고유해집니다. 이를 위해서는 거부 후 샘플링 확률을 추정하기 위한 몇 가지 근사치가 필요합니다. |
범위최대 | 샘플러는 간격 [0, range_max)에서 정수를 샘플링합니다. |
옵션 | 선택적 속성 값을 전달합니다. |
보고
- LearnedUnigramCandidateSampler의 새로운 인스턴스
공개 출력 < TFloat32 > samplingdExpectedCount ()
각 샘플링된 후보에 대해 길이가 num_sampled인 벡터는 샘플링된 후보 배치에서 후보가 발생할 것으로 예상되는 횟수를 나타냅니다. Unique=true인 경우 이는 확률입니다.
공개 정적 LearnedUnigramCandidateSampler.Options 시드 (긴 시드)
매개변수
씨앗 | Seed 또는 Seed2가 0이 아닌 값으로 설정된 경우 난수 생성기는 지정된 시드에 의해 시드됩니다. 그렇지 않으면 무작위 시드에 의해 시드됩니다. |
---|