Mfcc

lớp cuối cùng công khai Mfcc

Chuyển đổi biểu đồ phổ thành dạng hữu ích cho việc nhận dạng giọng nói.

Hệ số Cepstral tần số Mel là một cách biểu diễn dữ liệu âm thanh có hiệu quả như một tính năng đầu vào cho máy học. Chúng được tạo ra bằng cách lấy phổ của ảnh phổ ('cestrum') và loại bỏ một số tần số cao hơn ít quan trọng hơn đối với tai người. Họ có lịch sử lâu đời trong thế giới nhận dạng giọng nói và https://en.wikipedia.org/wiki/Mel-information_ceptstrum là một nguồn tài nguyên tốt để tìm hiểu thêm.

Các lớp lồng nhau

lớp học Mfcc.Options Thuộc tính tùy chọn cho Mfcc

Hằng số

Sợi dây OP_NAME Tên của op này, được biết đến bởi công cụ lõi TensorFlow

Phương pháp công khai

Đầu ra < TFloat32 >
asOutput ()
Trả về tay cầm tượng trưng của tensor.
Mfcc tĩnh
tạo ( Phạm vi phạm vi, Toán hạng < TFloat32 > biểu đồ phổ, Toán hạng < TInt32 > sampleRate, Tùy chọn... tùy chọn)
Phương thức xuất xưởng để tạo một lớp bao bọc một hoạt động Mfcc mới.
Mfcc.Options tĩnh
dctCofactorCount (DctCofactorCount dài)
Mfcc.Options tĩnh
filterbankChannelCount (Ngân hàng lọc dàiChannelCount)
Mfcc.Options tĩnh
giới hạn tần số thấp hơn (Giới hạn tần số thả nổi thấp hơn)
Đầu ra < TFloat32 >
Mfcc.Options tĩnh
giới hạn tần số trên (Giới hạn tần số nổi trên)

Phương pháp kế thừa

Hằng số

Chuỗi cuối cùng tĩnh công khai OP_NAME

Tên của op này, được biết đến bởi công cụ lõi TensorFlow

Giá trị không đổi: "Mfcc"

Phương pháp công khai

Đầu ra công khai < TFloat32 > asOutput ()

Trả về tay cầm tượng trưng của tensor.

Đầu vào của các hoạt động TensorFlow là đầu ra của một hoạt động TensorFlow khác. Phương pháp này được sử dụng để thu được một thẻ điều khiển mang tính biểu tượng đại diện cho việc tính toán đầu vào.

tạo Mfcc tĩnh công khai (Phạm vi phạm vi , Toán hạng < TFloat32 > biểu đồ phổ, Toán hạng < TInt32 > sampleRate, Tùy chọn... tùy chọn)

Phương thức xuất xưởng để tạo một lớp bao bọc một hoạt động Mfcc mới.

Thông số
phạm vi phạm vi hiện tại
quang phổ Thường được tạo ra bởi Spectrogram op, với độ lớn_squared được đặt thành true.
tỷ lệ mẫu Âm thanh nguồn được sử dụng bao nhiêu mẫu mỗi giây.
tùy chọn mang các giá trị thuộc tính tùy chọn
Trả lại
  • một phiên bản mới của Mfcc

public static Mfcc.Options dctCofactorCount (DctCofactorCount dài)

Thông số
dctHệ sốĐếm Có bao nhiêu kênh đầu ra cần sản xuất trên mỗi lát thời gian.

public static Mfcc.Options filterbankChannelCount (Bộ lọc dàiChannelCount)

Thông số
ngân hàng lọcKênhĐếm Nghị quyết của ngân hàng Mel được sử dụng nội bộ.

public static Mfcc.Options lowFrequencyLimit (Float lowFrequencyLimit)

Thông số
giới hạn tần số thấp hơn Tần số thấp nhất được sử dụng khi tính toán ceptstrum.

Đầu ra công khai < TFloat32 > đầu ra ()

public static Mfcc.Options UpperFrequencyLimit (Float UpperFrequencyLimit)

Thông số
giới hạn tần số trên Tần số cao nhất được sử dụng khi tính toán ceptstrum.