DeepFilterNet3 — Android

DeepFilterNet3は、STFT/ERBベースのノイズ抑制を使用して、ONNX Runtime経由でAndroidとembedded Linux上で動作します。VADとSTTの前にマイク入力を処理し、ノイズの多い環境でよりクリーンな文字起こしを提供します。

モデル

モデルバックエンドサイズHuggingFace
DeepFilterNet3ONNX Runtime約8 MBaufklarer/DeepFilterNet3-ONNX

パフォーマンス

指標
RTF約0.15(リアルタイム対応)
処理STFT/ERBベースノイズ抑制
モデルファイルdeepfilter-auxiliary.bin
重要

Androidでは、ノイズキャンセリングはSpeechPipelineに統合されており、VADとSTTの前にマイク入力で自動的に実行されます。スタンドアロンAPIは必要ありません。統合の詳細についてはGitHub上のspeech-androidを参照してください。

ソースコード: github.com/soniqo/speech-android