ถอดรหัสไฟล์ PCM WAV 16 บิตเป็นโฟลตเทนเซอร์
ค่า 16 บิตที่เซ็นชื่อ -32768 ถึง 32767 จะถูกปรับขนาดเป็น -1.0 ถึง 1.0 ในรูปแบบทศนิยม
เมื่อตั้งค่าdesir_channels หากอินพุตมีช่องน้อยกว่านี้ ช่องสุดท้ายจะถูกทำซ้ำเพื่อให้หมายเลขที่ร้องขอ มิฉะนั้น หากอินพุตมีช่องมากกว่าที่ร้องขอ ช่องเพิ่มเติมจะถูกละเว้น
หากตั้งค่า Wish_samples เสียงจะถูกครอบตัดหรือเสริมด้วยศูนย์ตามความยาวที่ต้องการ
เอาต์พุตแรกประกอบด้วยเทนเซอร์พร้อมเนื้อหาของตัวอย่างเสียง มิติข้อมูลต่ำสุดคือจำนวนช่อง และส่วนที่สองคือจำนวนตัวอย่าง ตัวอย่างเช่น ไฟล์สเตอริโอ WAV ที่มีความยาวสิบตัวอย่างควรให้รูปร่างเอาต์พุตเป็น [10, 2]
คลาสที่ซ้อนกัน
ระดับ | DecodeWav.ตัวเลือก | คุณลักษณะเพิ่มเติมสำหรับ DecodeWav |
ค่าคงที่
สตริง | OP_NAME | ชื่อของ op นี้ ซึ่งรู้จักกันในชื่อของเอ็นจิ้นหลัก TensorFlow |
วิธีการสาธารณะ
เอาท์พุต < TFloat32 > | เสียง () 2-D ที่มีรูปร่าง `[ความยาว, ช่องสัญญาณ]` |
DecodeWav แบบคงที่ | สร้าง (ขอบเขต ขอบเขต ตัวดำเนินการ < TString > เนื้อหา ตัวเลือก... ตัวเลือก) วิธีการจากโรงงานเพื่อสร้างคลาสที่รวมการดำเนินการ DecodeWav ใหม่ |
DecodeWav.Options แบบคงที่ | ช่องที่ต้องการ (ช่องที่ต้องการยาว) |
DecodeWav.Options แบบคงที่ | ตัวอย่างที่ต้องการ (ตัวอย่างที่ต้องการแบบยาว) |
เอาท์พุต < TInt32 > | อัตราตัวอย่าง () สเกลาร์ถืออัตราตัวอย่างที่พบในส่วนหัว WAV |
วิธีการสืบทอด
ค่าคงที่
สตริงสุดท้ายแบบคงที่สาธารณะ OP_NAME
ชื่อของ op นี้ ซึ่งรู้จักกันในชื่อของเอ็นจิ้นหลัก TensorFlow
วิธีการสาธารณะ
การสร้าง DecodeWav แบบคงที่สาธารณะ ( ขอบเขต ขอบเขต ตัวดำเนินการ < TString > เนื้อหา ตัวเลือก... ตัวเลือก)
วิธีการจากโรงงานเพื่อสร้างคลาสที่รวมการดำเนินการ DecodeWav ใหม่
พารามิเตอร์
ขอบเขต | ขอบเขตปัจจุบัน |
---|---|
เนื้อหา | เสียงที่เข้ารหัส WAV ซึ่งมักจะมาจากไฟล์ |
ตัวเลือก | มีค่าแอตทริบิวต์ทางเลือก |
การส่งคืน
- ตัวอย่างใหม่ของ DecodeWav
สาธารณะ DecodeWav.Options คง ที่ที่ต้องการช่อง (ช่องที่ต้องการยาว)
พารามิเตอร์
ช่องที่ต้องการ | จำนวนช่องตัวอย่างที่ต้องการ |
---|
สาธารณะ DecodeWav.Options แบบคงที่ ที่ต้องการตัวอย่าง (ตัวอย่างที่ต้องการแบบยาว)
พารามิเตอร์
ตัวอย่างที่ต้องการ | ความยาวของเสียงที่ร้องขอ |
---|