CTCLossV2

공개 최종 클래스 CTCLossV2

각 배치 항목에 대한 CTC 손실(로그 확률)을 계산합니다. 또한 계산

그라데이션. 이 클래스는 소프트맥스 연산을 수행하므로 입력은 예를 들어 LSTM에 의한 출력의 선형 투영이어야 합니다.

중첩 클래스

수업 CTCLossV2.옵션 CTCLossV2 의 선택적 속성

공개 방법

정적 CTCLossV2
생성 ( 범위 범위, 피연산자 <Float> 입력, 피연산자 <Long> labelsIndices, 피연산자 <Integer> labelsValues, 피연산자 <Integer> 순서 길이, 옵션... 옵션)
새로운 CTCLossV2 작업을 래핑하는 클래스를 생성하는 팩토리 메서드입니다.
정적 CTCLossV2.Options
ctcMergeRepeated (부울 ctcMergeRepeated)
출력 <플로트>
그라데이션 ()
'손실'의 기울기.
정적 CTCLossV2.Options
ignoreLongerOutputsThanInputs (부울인ignoreLongerOutputsThanInputs)
출력 <플로트>
손실 ()
로그 확률을 포함하는 벡터(배치)입니다.
정적 CTCLossV2.Options
preprocessCollapseRepeated (부울 preprocessCollapseRepeated)

상속된 메서드

공개 방법

공개 정적 CTCLossV2 생성 ( 범위 범위, 피연산자 <Float> 입력, 피연산자 <Long> labelsIndices, 피연산자 <Integer> labelsValues, 피연산자 <Integer> 시퀀스 길이, 옵션... 옵션)

새로운 CTCLossV2 작업을 래핑하는 클래스를 생성하는 팩토리 메서드입니다.

매개변수
범위 현재 범위
입력 3차원, 모양: `(max_time x 배치_크기 x num_classes)`, 로지트. 기본 빈 레이블은 num_classes - 1이 아닌 0입니다.
라벨인덱스 `SparseTensor의 인덱스 `. `labels_indices(i, :) == [b, t]`는 `labels_values(i)`가 `(batch b, time t)`에 대한 ID를 저장한다는 의미입니다.
레이블값 지정된 배치 및 시간과 관련된 값(레이블)입니다.
시퀀스 길이 시퀀스 길이를 포함하는 벡터(배치)입니다.
옵션 선택적 속성 값을 전달합니다.
보고
  • CTCLossV2의 새로운 인스턴스

공개 정적 CTCLossV2.Options ctcMergeRepeated (부울 ctcMergeRepeated)

매개변수
ctcMerge반복됨 스칼라. false로 설정하면 CTC 계산 중에 공백이 아닌 반복 레이블이 병합되지 않고 개별 레이블로 해석됩니다. 이것은 CTC의 단순화된 버전입니다.

공개 출력 <Float> 그래디언트 ()

'손실'의 기울기. 3D, 모양: `(최대_시간 x 배치_크기 x num_classes)`.

공개 정적 CTCLossV2.OptionsignoreLongerOutputsThanInputs ( BooleanignoreLongerOutputsThanInputs)

매개변수
입력보다 긴 출력 무시 스칼라. true로 설정하면 CTC 계산 중에 입력 시퀀스보다 긴 출력 시퀀스가 ​​있는 항목을 건너뜁니다. 이러한 항목은 손실 항에 기여하지 않으며 기울기가 0입니다.

공개 출력 <Float> 손실 ()

로그 확률을 포함하는 벡터(배치)입니다.

공개 정적 CTCLossV2.Options preprocessCollapseRepeated (부울 preprocessCollapseRepeated)

매개변수
전처리접기반복됨 스칼라. true인 경우 CTC 계산 전에 반복되는 라벨이 축소됩니다.