DeepFilterNet3 — Android

DeepFilterNet3 ทำงานบน Android และ Linux แบบฝังตัวผ่าน ONNX Runtime โดยใช้การลดเสียงรบกวนที่อาศัย STFT/ERB โมเดลประมวลผลอินพุตจากไมโครโฟนก่อน VAD และ STT จึงให้การถอดเสียงที่สะอาดขึ้นในสภาพแวดล้อมที่มีเสียงรบกวนสูง

โมเดล

โมเดลBackendขนาดHuggingFace
DeepFilterNet3ONNX Runtime~8 MBaufklarer/DeepFilterNet3-ONNX

ประสิทธิภาพ

ตัวชี้วัดค่า
RTF~0.15 (รองรับเรียลไทม์)
การประมวลผลการลดเสียงรบกวนที่อาศัย STFT/ERB
ไฟล์โมเดลdeepfilter-auxiliary.bin
สำคัญ

บน Android การลดเสียงรบกวนถูกผนวกเข้ากับ SpeechPipeline และทำงานอัตโนมัติบนอินพุตของไมโครโฟนก่อน VAD และ STT ไม่จำเป็นต้องมี API แบบอิสระ ดู speech-android บน GitHub สำหรับรายละเอียดการรวมระบบ

โค้ดต้นทาง: github.com/soniqo/speech-android