공개 최종 수업 Mfcc
스펙트로그램을 음성 인식에 유용한 형식으로 변환합니다.
멜 주파수 켑스트럴 계수는 기계 학습의 입력 기능으로 효과적인 오디오 데이터를 표현하는 방법입니다. 이는 스펙트로그램('켑스트럼')의 스펙트럼을 취하고 사람의 귀에 덜 중요한 일부 고주파수를 삭제하여 생성됩니다. 음성 인식 분야에서는 오랜 역사를 갖고 있으며 https://en.wikipedia.org/wiki/Mel-주파수_cepstrum은 자세한 내용을 알아볼 수 있는 좋은 리소스입니다.
중첩 클래스
수업 | Mfcc.옵션 | Mfcc 의 선택적 속성 |
상수
끈 | OP_NAME | TensorFlow 핵심 엔진에서 알려진 이 작업의 이름 |
공개 방법
출력 < TFloat32 > | 출력 () 텐서의 기호 핸들을 반환합니다. |
정적 Mfcc | |
정적 Mfcc.옵션 | dctCoefficientCount (긴 dctCoefficientCount) |
정적 Mfcc.옵션 | filterbankChannelCount (Long filterbankChannelCount) |
정적 Mfcc.옵션 | lowerFrequencyLimit (부동 lowerFrequencyLimit) |
출력 < TFloat32 > | 출력 () |
정적 Mfcc.옵션 | upperFrequencyLimit (부동 upperFrequencyLimit) |
상속된 메서드
상수
공개 정적 최종 문자열 OP_NAME
TensorFlow 핵심 엔진에서 알려진 이 작업의 이름
상수 값: "Mfcc"
공개 방법
공개 출력 < TFloat32 > asOutput ()
텐서의 기호 핸들을 반환합니다.
TensorFlow 작업에 대한 입력은 다른 TensorFlow 작업의 출력입니다. 이 메서드는 입력 계산을 나타내는 기호 핸들을 얻는 데 사용됩니다.
공개 정적 Mfcc 생성 ( 범위 범위, 피연산자 < TFloat32 > 스펙트로그램, 피연산자 < TInt32 > SampleRate, 옵션... 옵션)
새 Mfcc 작업을 래핑하는 클래스를 생성하는 팩토리 메서드입니다.
매개변수
범위 | 현재 범위 |
---|---|
스펙트로그램 | 일반적으로 Magnitude_squared가 true로 설정된 Spectrogram 작업에 의해 생성됩니다. |
샘플 속도 | 소스 오디오가 사용하는 초당 샘플 수입니다. |
옵션 | 선택적 속성 값을 전달합니다. |
보고
- Mfcc의 새 인스턴스
공개 정적 Mfcc.Options dctCoefficientCount (Long dctCoefficientCount)
매개변수
dct계수개수 | 타임 슬라이스당 생성할 출력 채널 수입니다. |
---|
공개 정적 Mfcc.Options filterbankChannelCount (Long filterbankChannelCount)
매개변수
filterbankChannelCount | 내부적으로 사용되는 Mel Bank의 해상도입니다. |
---|
공개 정적 Mfcc.Options lowerFrequencyLimit (Float lowerFrequencyLimit)
매개변수
낮은주파수한도 | 셉트럼을 계산할 때 사용할 가장 낮은 주파수입니다. |
---|
공개 정적 Mfcc.Options upperFrequencyLimit (부동 upperFrequencyLimit)
매개변수
상한주파수한계 | 셉트럼을 계산할 때 사용할 가장 높은 주파수입니다. |
---|