Mfcc

Mfcc คลาสสุดท้ายสาธารณะ

แปลงสเปกโตรแกรมให้เป็นรูปแบบที่มีประโยชน์สำหรับการรู้จำคำพูด

ค่าสัมประสิทธิ์เซปสตรัลความถี่เมลเป็นวิธีหนึ่งในการแสดงข้อมูลเสียงที่มีประสิทธิภาพในฐานะฟีเจอร์อินพุตสำหรับแมชชีนเลิร์นนิง พวกมันถูกสร้างขึ้นโดยการใช้สเปกตรัมของสเปกตรัม ('เซปสตรัม') และละทิ้งความถี่ที่สูงกว่าบางส่วนซึ่งมีความสำคัญน้อยกว่าต่อหูของมนุษย์ พวกเขามีประวัติศาสตร์อันยาวนานในโลกแห่งการรู้จำเสียง และ https://en.wikipedia.org/wiki/Mel-frequency_cepstrum เป็นแหล่งข้อมูลที่ดีในการเรียนรู้เพิ่มเติม

คลาสที่ซ้อนกัน

ระดับ Mfcc.ตัวเลือก แอ็ตทริบิวต์ทางเลือกสำหรับ Mfcc

ค่าคงที่

สตริง OP_NAME ชื่อของ op นี้ ซึ่งรู้จักกันในชื่อของเอ็นจิ้นหลัก TensorFlow

วิธีการสาธารณะ

เอาท์พุต < TFloat32 >
เป็นเอาท์พุต ()
ส่งกลับค่าแฮนเดิลสัญลักษณ์ของเทนเซอร์
Mfcc แบบคงที่
สร้าง (ขอบเขต ขอบเขต ตัวดำเนินการ < TFloat32 > สเปกโตรแกรม ตัวดำเนินการ < TInt32 > SampleRate ตัวเลือก... ตัวเลือก)
วิธีการจากโรงงานเพื่อสร้างคลาสที่รวมการดำเนินการ Mfcc ใหม่
Mfcc.Options แบบคงที่
dctCoefficientCount (dctCoefficientCount แบบยาว)
Mfcc.Options แบบคงที่
filterbankChannelCount (กรองยาว BankChannelCount)
Mfcc.Options แบบคงที่
lowerFrequencyLimit (ลอยต่ำกว่าFrequencyLimit)
เอาท์พุต < TFloat32 >
Mfcc.Options แบบคงที่
upperFrequencyLimit (ลอยบนFrequencyLimit)

วิธีการสืบทอด

ค่าคงที่

สตริงสุดท้ายแบบคงที่สาธารณะ OP_NAME

ชื่อของ op นี้ ซึ่งรู้จักกันในชื่อของเอ็นจิ้นหลัก TensorFlow

ค่าคงที่: "Mfcc"

วิธีการสาธารณะ

เอาท์พุท สาธารณะ < TFloat32 > asOutput ()

ส่งกลับค่าแฮนเดิลสัญลักษณ์ของเทนเซอร์

อินพุตสำหรับการดำเนินการ TensorFlow คือเอาต์พุตของการดำเนินการ TensorFlow อื่น วิธีการนี้ใช้เพื่อรับหมายเลขอ้างอิงสัญลักษณ์ที่แสดงถึงการคำนวณอินพุต

การสร้าง Mfcc แบบคงที่สาธารณะ (ขอบเขต ขอบเขต ตัวดำเนินการ < TFloat32 > สเปกโตรแกรม ตัวดำเนินการ < TInt32 > ตัวอย่างเรต ตัวเลือก... ตัวเลือก)

วิธีการจากโรงงานเพื่อสร้างคลาสที่รวมการดำเนินการ Mfcc ใหม่

พารามิเตอร์
ขอบเขต ขอบเขตปัจจุบัน
สเปกโตรแกรม โดยทั่วไปแล้วจะผลิตโดย Spectrogram op โดยตั้งค่า magnitude_squared ให้เป็นจริง
อัตราตัวอย่าง เสียงต้นฉบับที่ใช้มีตัวอย่างกี่ตัวอย่างต่อวินาที
ตัวเลือก มีค่าแอตทริบิวต์ทางเลือก
การส่งคืน
  • อินสแตนซ์ใหม่ของ Mfcc

Mfcc.Options สาธารณะคงที่ dctCoefficientCount (dctCoefficientCount แบบยาว)

พารามิเตอร์
dctค่าสัมประสิทธิ์การนับ จำนวนช่องสัญญาณเอาท์พุตที่จะสร้างต่อการแบ่งเวลา

Mfcc.Options สาธารณะคง filterbankChannelCount (กรองยาว BankChannelCount)

พารามิเตอร์
filterbankChannelCount ความละเอียดของธนาคาร Mel ที่ใช้ภายใน

Mfcc.Options คงที่สาธารณะ lowerFrequencyLimit (Float lowerFrequencyLimit)

พารามิเตอร์
ขีดจำกัดความถี่ที่ต่ำกว่า ความถี่ต่ำสุดที่จะใช้เมื่อคำนวณ ceptstrum

เอาท์พุท สาธารณะ < TFloat32 > เอาท์พุท ()

Mfcc.Options คงที่สาธารณะ upperFrequencyLimit (Float upperFrequencyLimit)

พารามิเตอร์
ขีดจำกัดความถี่บน ความถี่สูงสุดที่จะใช้เมื่อคำนวณ ceptstrum