DeepFilterNet3 — Android
DeepFilterNet3 ONNX Runtime के माध्यम से Android और एम्बेडेड Linux पर चलता है, STFT/ERB-आधारित नॉइज़ सप्रेशन का उपयोग करते हुए। यह VAD और STT से पहले माइक्रोफ़ोन इनपुट को प्रोसेस करता है, noisy वातावरण में साफ़ ट्रांसक्रिप्शन प्रदान करता है।
मॉडल
| मॉडल | बैकएंड | आकार | HuggingFace |
|---|---|---|---|
| DeepFilterNet3 | ONNX Runtime | ~8 MB | aufklarer/DeepFilterNet3-ONNX |
परफ़ॉर्मेंस
| मेट्रिक | मान |
|---|---|
| RTF | ~0.15 (रियल-टाइम सक्षम) |
| प्रोसेसिंग | STFT/ERB-आधारित नॉइज़ सप्रेशन |
| मॉडल फ़ाइल | deepfilter-auxiliary.bin |
महत्वपूर्ण
Android पर, नॉइज़ कैंसलेशन SpeechPipeline में एकीकृत है और VAD और STT से पहले माइक इनपुट पर स्वचालित रूप से चलता है। किसी standalone API की आवश्यकता नहीं है। इंटीग्रेशन विवरण के लिए GitHub पर speech-android देखें।
सोर्स कोड: github.com/soniqo/speech-android