DeepFilterNet3 — Android
DeepFilterNet3 läuft auf Android und eingebettetem Linux über ONNX Runtime und nutzt STFT/ERB-basierte Rauschunterdrückung. Es verarbeitet den Mikrofoneingang vor VAD und STT und ermöglicht so saubereres Transkribieren in lauten Umgebungen.
Modell
| Modell | Backend | Größe | HuggingFace |
|---|---|---|---|
| DeepFilterNet3 | ONNX Runtime | ~8 MB | aufklarer/DeepFilterNet3-ONNX |
Leistung
| Metrik | Wert |
|---|---|
| RTF | ~0,15 (echtzeitfähig) |
| Verarbeitung | STFT/ERB-basierte Rauschunterdrückung |
| Modelldatei | deepfilter-auxiliary.bin |
Wichtig
Auf Android ist die Rauschunterdrückung in die SpeechPipeline integriert und läuft automatisch auf dem Mikrofoneingang vor VAD und STT. Es wird keine eigenständige API benötigt. Siehe speech-android auf GitHub für Integrationsdetails.
Quellcode: github.com/soniqo/speech-android