DeepFilterNet3 — Android

DeepFilterNet3 läuft auf Android, eingebettetem Linux und Windows über ONNX Runtime und nutzt STFT/ERB-basierte Rauschunterdrückung. Es verarbeitet den Mikrofoneingang vor VAD und STT und ermöglicht so saubereres Transkribieren in lauten Umgebungen.

Modell

Modell	Backend	Größe	HuggingFace
DeepFilterNet3	ONNX Runtime	~8 MB	soniqo/DeepFilterNet3-ONNX

Leistung

Metrik	Wert
RTF	~0,15 (echtzeitfähig)
Verarbeitung	STFT/ERB-basierte Rauschunterdrückung
Modelldatei	`deepfilter-auxiliary.bin`

Wichtig

Auf Android ist die Rauschunterdrückung in die SpeechPipeline integriert und läuft automatisch auf dem Mikrofoneingang vor VAD und STT. Es wird keine eigenständige API benötigt. Siehe speech-android auf GitHub für Integrationsdetails.

Quellcode: github.com/soniqo/speech-android