Mfcc

공개 최종 수업 Mfcc

스펙트로그램을 음성 인식에 유용한 형식으로 변환합니다.

멜 주파수 켑스트럴 계수는 기계 학습의 입력 기능으로 효과적인 오디오 데이터를 표현하는 방법입니다. 이는 스펙트로그램('켑스트럼')의 스펙트럼을 취하고 사람의 귀에 덜 중요한 일부 고주파수를 삭제하여 생성됩니다. 음성 인식 분야에서는 오랜 역사를 갖고 있으며 https://en.wikipedia.org/wiki/Mel-주파수_cepstrum은 자세한 내용을 알아볼 수 있는 좋은 리소스입니다.

중첩 클래스

수업 Mfcc.옵션 Mfcc 의 선택적 속성

상수

OP_NAME TensorFlow 핵심 엔진에서 알려진 이 작업의 이름

공개 방법

출력 < TFloat32 >
출력 ()
텐서의 기호 핸들을 반환합니다.
정적 Mfcc
생성 ( 범위 범위, 피연산자 < TFloat32 > 스펙트로그램, 피연산자 < TInt32 > SampleRate, 옵션... 옵션)
새 Mfcc 작업을 래핑하는 클래스를 생성하는 팩토리 메서드입니다.
정적 Mfcc.옵션
dctCoefficientCount (긴 dctCoefficientCount)
정적 Mfcc.옵션
filterbankChannelCount (Long filterbankChannelCount)
정적 Mfcc.옵션
lowerFrequencyLimit (부동 lowerFrequencyLimit)
출력 < TFloat32 >
출력 ()
정적 Mfcc.옵션
upperFrequencyLimit (부동 upperFrequencyLimit)

상속된 메서드

상수

공개 정적 최종 문자열 OP_NAME

TensorFlow 핵심 엔진에서 알려진 이 작업의 이름

상수 값: "Mfcc"

공개 방법

공개 출력 < TFloat32 > asOutput ()

텐서의 기호 핸들을 반환합니다.

TensorFlow 작업에 대한 입력은 다른 TensorFlow 작업의 출력입니다. 이 메서드는 입력 계산을 나타내는 기호 핸들을 얻는 데 사용됩니다.

공개 정적 Mfcc 생성 ( 범위 범위, 피연산자 < TFloat32 > 스펙트로그램, 피연산자 < TInt32 > SampleRate, 옵션... 옵션)

새 Mfcc 작업을 래핑하는 클래스를 생성하는 팩토리 메서드입니다.

매개변수
범위 현재 범위
스펙트로그램 일반적으로 Magnitude_squared가 true로 설정된 Spectrogram 작업에 의해 생성됩니다.
샘플 속도 소스 오디오가 사용하는 초당 샘플 수입니다.
옵션 선택적 속성 값을 전달합니다.
보고
  • Mfcc의 새 인스턴스

공개 정적 Mfcc.Options dctCoefficientCount (Long dctCoefficientCount)

매개변수
dct계수개수 타임 슬라이스당 생성할 출력 채널 수입니다.

공개 정적 Mfcc.Options filterbankChannelCount (Long filterbankChannelCount)

매개변수
filterbankChannelCount 내부적으로 사용되는 Mel Bank의 해상도입니다.

공개 정적 Mfcc.Options lowerFrequencyLimit (Float lowerFrequencyLimit)

매개변수
낮은주파수한도 셉트럼을 계산할 때 사용할 가장 낮은 주파수입니다.

공개 출력 < TFloat32 > 출력 ()

공개 정적 Mfcc.Options upperFrequencyLimit (부동 upperFrequencyLimit)

매개변수
상한주파수한계 셉트럼을 계산할 때 사용할 가장 높은 주파수입니다.