ถอดรหัสไฟล์ PCM WAV 16 บิตเป็นโฟลตเทนเซอร์
ค่า 16 บิตที่เซ็นชื่อ -32768 ถึง 32767 จะถูกปรับขนาดเป็น -1.0 ถึง 1.0 ในรูปแบบทศนิยม
เมื่อตั้งค่าdesir_channels หากอินพุตมีช่องน้อยกว่านี้ ช่องสุดท้ายจะถูกทำซ้ำเพื่อให้หมายเลขที่ร้องขอ มิฉะนั้น หากอินพุตมีช่องมากกว่าที่ร้องขอ ช่องเพิ่มเติมจะถูกละเว้น
หากตั้งค่า Wish_samples เสียงจะถูกครอบตัดหรือเสริมด้วยศูนย์ตามความยาวที่ต้องการ
เอาต์พุตแรกประกอบด้วยเทนเซอร์พร้อมเนื้อหาของตัวอย่างเสียง มิติข้อมูลต่ำสุดคือจำนวนช่อง และส่วนที่สองคือจำนวนตัวอย่าง ตัวอย่างเช่น ไฟล์สเตอริโอ WAV ที่มีความยาวสิบตัวอย่างควรให้รูปร่างเอาต์พุตเป็น [10, 2]
คลาสที่ซ้อนกัน
| ระดับ | DecodeWav.ตัวเลือก | คุณลักษณะเพิ่มเติมสำหรับ DecodeWav | |
ค่าคงที่
| สตริง | OP_NAME | ชื่อของ op นี้ ซึ่งรู้จักกันในชื่อของเอ็นจิ้นหลัก TensorFlow |
วิธีการสาธารณะ
| เอาท์พุต < TFloat32 > | เสียง () 2-D ที่มีรูปร่าง `[ความยาว, ช่องสัญญาณ]` |
| DecodeWav แบบคงที่ | สร้าง (ขอบเขต ขอบเขต ตัวดำเนินการ < TString > เนื้อหา ตัวเลือก... ตัวเลือก) วิธีการจากโรงงานเพื่อสร้างคลาสที่รวมการดำเนินการ DecodeWav ใหม่ |
| DecodeWav.Options แบบคงที่ | ช่องที่ต้องการ (ช่องที่ต้องการยาว) |
| DecodeWav.Options แบบคงที่ | ตัวอย่างที่ต้องการ (ตัวอย่างที่ต้องการแบบยาว) |
| เอาท์พุต < TInt32 > | อัตราตัวอย่าง () สเกลาร์ถืออัตราตัวอย่างที่พบในส่วนหัว WAV |
วิธีการสืบทอด
ค่าคงที่
สตริงสุดท้ายแบบคงที่สาธารณะ OP_NAME
ชื่อของ op นี้ ซึ่งรู้จักกันในชื่อของเอ็นจิ้นหลัก TensorFlow
วิธีการสาธารณะ
การสร้าง DecodeWav แบบคงที่สาธารณะ ( ขอบเขต ขอบเขต ตัวดำเนินการ < TString > เนื้อหา ตัวเลือก... ตัวเลือก)
วิธีการจากโรงงานเพื่อสร้างคลาสที่รวมการดำเนินการ DecodeWav ใหม่
พารามิเตอร์
| ขอบเขต | ขอบเขตปัจจุบัน |
|---|---|
| เนื้อหา | เสียงที่เข้ารหัส WAV ซึ่งมักจะมาจากไฟล์ |
| ตัวเลือก | มีค่าแอตทริบิวต์ทางเลือก |
การส่งคืน
- ตัวอย่างใหม่ของ DecodeWav
สาธารณะ DecodeWav.Options คง ที่ที่ต้องการช่อง (ช่องที่ต้องการยาว)
พารามิเตอร์
| ช่องที่ต้องการ | จำนวนช่องตัวอย่างที่ต้องการ |
|---|
สาธารณะ DecodeWav.Options แบบคงที่ ที่ต้องการตัวอย่าง (ตัวอย่างที่ต้องการแบบยาว)
พารามิเตอร์
| ตัวอย่างที่ต้องการ | ความยาวของเสียงที่ร้องขอ |
|---|