DeepFilterNet3 — Android
DeepFilterNet3は、STFT/ERBベースのノイズ抑制を使用して、ONNX Runtime経由でAndroidとembedded Linux上で動作します。VADとSTTの前にマイク入力を処理し、ノイズの多い環境でよりクリーンな文字起こしを提供します。
モデル
| モデル | バックエンド | サイズ | HuggingFace |
|---|---|---|---|
| DeepFilterNet3 | ONNX Runtime | 約8 MB | aufklarer/DeepFilterNet3-ONNX |
パフォーマンス
| 指標 | 値 |
|---|---|
| RTF | 約0.15(リアルタイム対応) |
| 処理 | STFT/ERBベースノイズ抑制 |
| モデルファイル | deepfilter-auxiliary.bin |
重要
Androidでは、ノイズキャンセリングはSpeechPipelineに統合されており、VADとSTTの前にマイク入力で自動的に実行されます。スタンドアロンAPIは必要ありません。統合の詳細についてはGitHub上のspeech-androidを参照してください。
ソースコード: github.com/soniqo/speech-android