공개 최종 클래스 DecodeWav
16비트 PCM WAV 파일을 부동 텐서로 디코딩합니다.
-32768~32767의 부호 있는 16비트 값은 부동 소수점 단위로 -1.0~1.0으로 크기가 조정됩니다.
Desired_channels가 설정된 경우 입력에 이보다 적은 수의 채널이 포함되어 있으면 마지막 채널이 복제되어 요청된 수를 제공하고, 입력에 요청된 것보다 더 많은 채널이 있으면 추가 채널이 무시됩니다.
Desired_samples가 설정되면 오디오가 요청된 길이에 맞게 잘리거나 0으로 채워집니다.
첫 번째 출력에는 오디오 샘플 내용이 포함된 Tensor가 포함되어 있습니다. 가장 낮은 차원은 채널 수이고 두 번째 차원은 샘플 수입니다. 예를 들어, 10개 샘플 길이의 스테레오 WAV 파일은 [10, 2]의 출력 형태를 제공해야 합니다.
중첩 클래스
수업 | DecodeWav.옵션 | DecodeWav 의 선택적 속성 |
상수
끈 | OP_NAME | TensorFlow 코어 엔진에서 알려진 이 작업의 이름 |
공개 방법
출력 < TFloat32 > | 오디오 () '[길이, 채널]' 모양의 2D입니다. |
정적 디코드Wav | |
정적 DecodeWav.Options | 원하는 채널 (긴 원하는 채널) |
정적 DecodeWav.Options | 원하는 샘플 (긴 원하는 샘플) |
출력 < TInt32 > | 샘플레이트 () WAV 헤더에 있는 샘플링 속도를 유지하는 스칼라입니다. |
상속된 메서드
상수
공개 정적 최종 문자열 OP_NAME
TensorFlow 코어 엔진에서 알려진 이 작업의 이름
상수 값: "DecodeWav"
공개 방법
공개 정적 DecodeWav 생성 ( 범위 범위, 피연산자 < TString > 내용, 옵션... 옵션)
새로운 DecodeWav 작업을 래핑하는 클래스를 생성하는 팩토리 메서드입니다.
매개변수
범위 | 현재 범위 |
---|---|
내용물 | 일반적으로 파일에서 가져온 WAV로 인코딩된 오디오입니다. |
옵션 | 선택적 속성 값을 전달합니다. |
보고
- DecodeWav의 새로운 인스턴스