デモ
Speech Demo (Android)
エコーパイプラインデモ — 音声を文字起こしし、合成してエコーバックします。リアルタイムVAD波形可視化、STT/TTSレイテンシー表示付きのチャットバブルUI。
Android 8+Parakeet TDTKokoroSilero VADDeepFilterNet3
Linux CLI Demo
embedded Linux向けのコマンドライン音声パイプライン。ALSAマイク入力またはstdin PCMパイプ。
Linux ARM64Linux x86_64ONNX Runtime
Androidデモ
プリビルドAPK(20 MB)をダウンロードするか、ソースからビルドします。
app-release.apk (署名済みAPK、20 MB)- モデルはHuggingFaceから自動ダウンロードされます(初回起動時約1.2 GB)
- Parakeet TDT v3 STT(114言語)、Kokoro 82M TTS(7言語)
- Silero VAD、DeepFilterNet3ノイズキャンセリング、バージインサポート
Linux CLIデモ
ビルドと実行:
cd linux && cmake -B build && cmake --build build
./build/speech_demo --model-dir /path/to/models