DeepFilterNet3 — Android

DeepFilterNet3 ONNX Runtime के माध्यम से Android और एम्बेडेड Linux पर चलता है, STFT/ERB-आधारित नॉइज़ सप्रेशन का उपयोग करते हुए। यह VAD और STT से पहले माइक्रोफ़ोन इनपुट को प्रोसेस करता है, noisy वातावरण में साफ़ ट्रांसक्रिप्शन प्रदान करता है।

मॉडल

मॉडलबैकएंडआकारHuggingFace
DeepFilterNet3ONNX Runtime~8 MBaufklarer/DeepFilterNet3-ONNX

परफ़ॉर्मेंस

मेट्रिकमान
RTF~0.15 (रियल-टाइम सक्षम)
प्रोसेसिंगSTFT/ERB-आधारित नॉइज़ सप्रेशन
मॉडल फ़ाइलdeepfilter-auxiliary.bin
महत्वपूर्ण

Android पर, नॉइज़ कैंसलेशन SpeechPipeline में एकीकृत है और VAD और STT से पहले माइक इनपुट पर स्वचालित रूप से चलता है। किसी standalone API की आवश्यकता नहीं है। इंटीग्रेशन विवरण के लिए GitHub पर speech-android देखें।

सोर्स कोड: github.com/soniqo/speech-android