DeepFilterNet3 — Android

DeepFilterNet3 läuft auf Android und eingebettetem Linux über ONNX Runtime und nutzt STFT/ERB-basierte Rauschunterdrückung. Es verarbeitet den Mikrofoneingang vor VAD und STT und ermöglicht so saubereres Transkribieren in lauten Umgebungen.

Modell

ModellBackendGrößeHuggingFace
DeepFilterNet3ONNX Runtime~8 MBaufklarer/DeepFilterNet3-ONNX

Leistung

MetrikWert
RTF~0,15 (echtzeitfähig)
VerarbeitungSTFT/ERB-basierte Rauschunterdrückung
Modelldateideepfilter-auxiliary.bin
Wichtig

Auf Android ist die Rauschunterdrückung in die SpeechPipeline integriert und läuft automatisch auf dem Mikrofoneingang vor VAD und STT. Es wird keine eigenständige API benötigt. Siehe speech-android auf GitHub für Integrationsdetails.

Quellcode: github.com/soniqo/speech-android