DeepFilterNet3 — Android
DeepFilterNet3 ทำงานบน Android และ Linux แบบฝังตัวผ่าน ONNX Runtime โดยใช้การลดเสียงรบกวนที่อาศัย STFT/ERB โมเดลประมวลผลอินพุตจากไมโครโฟนก่อน VAD และ STT จึงให้การถอดเสียงที่สะอาดขึ้นในสภาพแวดล้อมที่มีเสียงรบกวนสูง
โมเดล
| โมเดล | Backend | ขนาด | HuggingFace |
|---|---|---|---|
| DeepFilterNet3 | ONNX Runtime | ~8 MB | aufklarer/DeepFilterNet3-ONNX |
ประสิทธิภาพ
| ตัวชี้วัด | ค่า |
|---|---|
| RTF | ~0.15 (รองรับเรียลไทม์) |
| การประมวลผล | การลดเสียงรบกวนที่อาศัย STFT/ERB |
| ไฟล์โมเดล | deepfilter-auxiliary.bin |
สำคัญ
บน Android การลดเสียงรบกวนถูกผนวกเข้ากับ SpeechPipeline และทำงานอัตโนมัติบนอินพุตของไมโครโฟนก่อน VAD และ STT ไม่จำเป็นต้องมี API แบบอิสระ ดู speech-android บน GitHub สำหรับรายละเอียดการรวมระบบ
โค้ดต้นทาง: github.com/soniqo/speech-android