Dataset

공개 추상 클래스 데이터 세트
알려진 직접 서브클래스

잠재적으로 큰 독립 요소(샘플) 목록을 나타내며 이러한 요소 전체에 걸쳐 반복 및 변환을 수행할 수 있습니다.

공공 생성자

데이터 세트 (Ops tf, Operand <?> 변형, List<Class<? 확장 TType >> outputTypes, List< Shape > outputShapes)

공개 방법

최종 데이터세트
배치 (긴 배치 크기, 부울 dropLastBatch)
이 데이터 세트의 요소를 배치로 그룹화합니다.
최종 데이터세트
배치 (긴 배치 크기)
이 데이터 세트의 요소를 배치로 그룹화합니다.
정적 데이터세트
fromTensorSlices (Ops tf, List< Operand <?>> 텐서, List<Class<? 확장 TType >> outputTypes)
요소가 주어진 텐서의 조각인 메모리 내 '데이터 세트'를 생성합니다.
운영
목록< 모양 >
getOutputShapes ()
이 데이터 세트의 각 구성 요소에 대한 모양 목록을 가져옵니다.
목록<클래스<? TType 확장 >>
getOutputTypes ()
이 데이터세트의 각 구성요소에 대한 출력 유형 목록을 가져옵니다.
피연산자 <?>
getVariant ()
이 데이터 세트를 나타내는 변형 텐서를 가져옵니다.
Iterator<목록< 피연산자 <?>>>
반복자 ()
이 Dataset의 모든 배치를 열심히 반복하는 반복자를 만듭니다.
데이터세트반복자
makeInitializeableIterator ()
이 데이터 세트의 요소를 반복하는 데 사용할 수 있는 `DatasetIterator`를 만듭니다.
데이터세트반복자
makeOneShotIterator ()
이 데이터 세트의 요소를 반복하는 데 사용할 수 있는 `DatasetIterator`를 만듭니다.
데이터세트
(Function<List< Operand <?>>, List< Operand <?>>> 매퍼)
이 데이터세트에서 반환된 모든 요소에 함수를 매핑하는 새 데이터세트를 반환합니다.
데이터세트
mapAllComponents (함수< 피연산자 <?>, 피연산자 <?>> 매퍼)
각 요소의 모든 구성요소에 대해 이 데이터세트의 모든 요소에 걸쳐 함수를 매핑하는 새 데이터세트를 반환합니다.
데이터세트
mapOneComponent (int 인덱스, Function< Operand <?>, Operand <?>> 매퍼)
각 요소의 단일 구성요소에서 이 데이터세트의 모든 요소에 걸쳐 함수를 매핑하는 새 데이터세트를 반환합니다.
최종 데이터세트
건너 뛰기 (긴 카운트)
이 데이터세트에서 초기 요소 `count`개를 건너뛰는 새 `데이터세트`를 반환합니다.
최종 데이터세트
걸릴 (긴 카운트)
이 데이터세트의 첫 번째 '개수' 요소만 포함된 새 '데이터세트'를 반환합니다.
정적 데이터세트
textLineDataset (Ops tf, 문자열 파일 이름, 문자열 압축 유형, 긴 버퍼 크기)
정적 데이터세트
tfRecordDataset (Ops tf, 문자열 파일 이름, 문자열 압축 유형, 긴 버퍼 크기)

상속된 메서드

공공 생성자

공개 데이터세트 (Ops tf, Operand <?> 변형, List<Class<? 확장 TType >> outputTypes, List< Shape > outputShapes)

공개 방법

공개 최종 데이터 세트 배치 (long BatchSize, 부울 dropLastBatch)

이 데이터 세트의 요소를 배치로 그룹화합니다.

매개변수
배치 크기 배치당 원하는 요소 수
dropLastBatch 'batchSize' 요소보다 적은 경우 최종 배치를 생략할지 여부입니다.
보고
  • 일괄 데이터 세트

공개 최종 데이터 세트 배치 (긴 배치 크기)

이 데이터 세트의 요소를 배치로 그룹화합니다. 'batchSize' 요소보다 적은 경우에도 마지막 배치를 포함합니다.

매개변수
배치 크기 배치당 원하는 요소 수
보고
  • 일괄 데이터 세트

공개 정적 데이터 세트 fromTensorSlices (Ops tf, List< Operand <?>> 텐서, List<Class<? 확장 TType >> outputTypes)

요소가 주어진 텐서의 조각인 메모리 내 '데이터 세트'를 생성합니다. 이 데이터세트의 각 요소는 제공된 텐서의 조각(예: 배치)을 나타내는 List<Operand<?>> 입니다.

매개변수
tf 작전 접근자
텐서 이 데이터 세트의 구성 요소(예: 기능, 레이블)를 나타내는 Operand<?> 목록
출력 유형 이 데이터 세트의 각 구성 요소의 데이터 유형을 나타내는 텐서 유형 클래스 목록입니다.
보고
  • 새로운 '데이터 세트'

공개 작전 getOpsInstance ()

공개 목록< 모양 > getOutputShapes ()

이 데이터 세트의 각 구성 요소에 대한 모양 목록을 가져옵니다.

공개 목록<클래스<? TType >> getOutputTypes 확장 ()

이 데이터세트의 각 구성요소에 대한 출력 유형 목록을 가져옵니다.

공용 피연산자 <?> getVariant ()

이 데이터 세트를 나타내는 변형 텐서를 가져옵니다.

공용 Iterator<List< 피연산자 <?>>> 반복자 ()

이 Dataset의 모든 배치를 열심히 반복하는 반복자를 만듭니다. 각 배치는 '출력' 객체로 반환되는 구성 요소 목록입니다.

이 방법을 사용하면 Eager 모드에서 실행할 때 일괄 처리를 통해 각 반복을 수행할 수 있습니다. 그래프 모드 일괄 반복에 대해서는 `makeOneShotIterator`를 참조하세요.

보고
  • 이 데이터 세트의 배치를 통한 반복자입니다.

공개 DatasetIterator makeInitializeableIterator ()

이 데이터 세트의 요소를 반복하는 데 사용할 수 있는 `DatasetIterator`를 만듭니다.

이 반복자는 루프에서 요소를 검색하기 전에 `iterator.makeInitializer(Dataset)`에 대한 호출로 초기화되어야 합니다.

보고
  • 이 데이터 세트의 구조를 기반으로 하는 새로운 `DatasetIterator`입니다.

공개 DatasetIterator makeOneShotIterator ()

이 데이터 세트의 요소를 반복하는 데 사용할 수 있는 `DatasetIterator`를 만듭니다. `makeOneShotIterator`를 사용하면 이 데이터세트에서 반복자가 자동으로 초기화됩니다. 건너뛰기 그래프 모드에서 초기화 작업은 `tf.init()`를 통해 실행되어야 하는 그래프의 초기화 목록에 추가됩니다.

예:

     try (Session session = new Session(graph) {
         // Immediately run initializers
         session.run(tf.init());
     }
 

Eager 모드에서는 이 호출의 결과로 초기화 프로그램이 자동으로 실행됩니다.

보고
  • 이 데이터 세트의 구조를 기반으로 하는 새로운 `DatasetIterator`입니다.

공용 데이터세트 (Function<List< Operand <?>>, List< Operand <?>>> 매퍼)

이 데이터세트에서 반환된 모든 요소에 함수를 매핑하는 새 데이터세트를 반환합니다.

예를 들어, 각 요소가 2개의 구성 요소(기능, 레이블)가 있는 List<Operand<?>> 라고 가정합니다.

dataset.map(components -> {
      Operand<?> features = components.get(0);
      Operand<?> labels   = components.get(1);

      return Arrays.asList(
        tf.math.mul(features, tf.constant(2)),
        tf.math.mul(labels, tf.constant(5))
      );
 );
 }
호출하면 'features' 및 'labels' 구성요소에 함수가 매핑되어 기능에 2를 곱하고 레이블에 5를 곱합니다.

매개변수
매퍼 이 반복자의 각 요소에 적용할 함수입니다.
보고
  • 이 반복자의 각 요소에 '매퍼'를 적용하는 새 데이터 세트입니다.

공용 데이터세트 mapAllComponents (함수< 피연산자 <?>, 피연산자 <?>> 매퍼)

각 요소의 모든 구성요소에 대해 이 데이터세트의 모든 요소에 걸쳐 함수를 매핑하는 새 데이터세트를 반환합니다.

예를 들어, 각 요소가 2개의 구성 요소(기능, 레이블)가 있는 List<Operand<?>> 라고 가정합니다.

dataset.mapAllComponents(component -> tf.math.mul(component, tf.constant(2))) 호출하면 각 요소의 `features` 및 `labels` 구성 요소 모두에 대해 함수를 매핑하여 모두 2를 곱합니다.

매개변수
매퍼 각 컴포넌트에 적용할 기능
보고
  • 각 요소의 모든 구성 요소에 '매퍼'를 적용하는 새로운 데이터 세트입니다.

공용 데이터세트 mapOneComponent (int index, Function< Operand <?>, Operand <?>> 매퍼)

각 요소의 단일 구성요소에서 이 데이터세트의 모든 요소에 걸쳐 함수를 매핑하는 새 데이터세트를 반환합니다.

예를 들어, 각 요소가 2개의 구성 요소(기능, 레이블)가 있는 List<Operand<?>> 라고 가정합니다.

dataset.mapOneComponent(0, features -> tf.math.mul(features, tf.constant(2))) 호출하면 각 요소의 `features` 구성 요소에 함수를 매핑하고 각 요소에 2를 곱합니다.

매개변수
색인 변환할 구성 요소의 인덱스입니다.
매퍼 대상 구성요소에 적용할 함수입니다.
보고
  • 선택한 인덱스의 구성 요소에 '매퍼'를 적용하는 새 데이터 세트입니다.

공개 최종 데이터세트 건너뛰기 (긴 개수)

이 데이터세트에서 초기 요소 `count`개를 건너뛰는 새 `데이터세트`를 반환합니다.

매개변수
세다 새 데이터세트를 형성하기 위해 '건너뛰기'할 요소의 수입니다.
보고
  • `count` 요소가 제거된 새 데이터세트입니다.

공개 최종 데이터 세트 소요 (긴 개수)

이 데이터세트의 첫 번째 '개수' 요소만 포함된 새 '데이터세트'를 반환합니다.

매개변수
세다 이 데이터세트에서 '가져올' 요소 수입니다.
보고
  • 이 데이터세트의 첫 번째 'count' 요소를 포함하는 새 데이터세트입니다.

공개 정적 데이터 세트 textLineDataset (Ops tf, 문자열 파일 이름, 문자열 압축 유형, 긴 버퍼 크기)

공개 정적 데이터 세트 tfRecordDataset (Ops tf, 문자열 파일 이름, 문자열 압축 유형, 긴 버퍼 크기)

공개 문자열 toString ()