CrossReplicaSum

공개 최종 클래스 CrossReplicaSum

복제된 TPU 인스턴스 전체에서 입력을 합산하는 작업입니다.

각 인스턴스는 자체 입력을 제공합니다.

예를 들어 `[A, B, C, D, E, F, G, H]`라는 8개의 TPU 인스턴스가 있다고 가정합니다. group_location=`[[0,2,4,6],[1,3,5,7]]`을 전달하면 `A, C, E, G`를 그룹 0으로 설정하고 `B, D, F, H`를 설정합니다. 그룹 1로. 따라서 출력은 다음과 같습니다: `[A+C+E+G, B+D+F+H, A+C+E+G, B+D+F+H, A+C+E+ G, B+D+F+H, A+C+E+G, B+D+F+H]`.

공개 방법

출력 <T>
출력 ()
텐서의 기호 핸들을 반환합니다.
static <T 확장 번호> CrossReplicaSum <T>
생성 ( Scope 범위, Operand <T> 입력, Operand <Integer> groupAssignment)
새로운 CrossReplicaSum 작업을 래핑하는 클래스를 생성하는 팩토리 메서드입니다.
출력 <T>
출력 ()
모든 분산 입력의 합계입니다.

상속된 메서드

공개 방법

공개 출력 <T> asOutput ()

텐서의 기호 핸들을 반환합니다.

TensorFlow 작업에 대한 입력은 다른 TensorFlow 작업의 출력입니다. 이 메서드는 입력 계산을 나타내는 기호 핸들을 얻는 데 사용됩니다.

공개 정적 CrossReplicaSum <T> 생성 ( 범위 범위, 피연산자 <T> 입력, 피연산자 <Integer> groupAssignment)

새로운 CrossReplicaSum 작업을 래핑하는 클래스를 생성하는 팩토리 메서드입니다.

매개변수
범위 현재 범위
입력 합계에 대한 로컬 입력입니다.
그룹할당 [num_groups, num_replicas_per_group] 형태의 int32 텐서. `group_location[i]`는 i번째 하위 그룹의 복제본 ID를 나타냅니다.
보고
  • CrossReplicaSum의 새 인스턴스

공개 출력 <T> 출력 ()

모든 분산 입력의 합계입니다.