Demos
Speech Demo (Android)
Echo 流水线 demo — 把语音转写后再合成出来。实时 VAD 波形可视化,带 STT/TTS 延迟显示的聊天气泡 UI。
Android 8+Parakeet TDTKokoroSilero VADDeepFilterNet3
Linux CLI Demo
面向嵌入式 Linux 的命令行语音流水线。支持 ALSA 麦克风输入或 stdin PCM 管道。
Linux ARM64Linux x86_64ONNX Runtime
Android Demo
下载预构建 APK(20 MB)或从源码构建:
app-release.apk (已签名 APK,20 MB)- 模型从 HuggingFace 自动下载(首次启动约 1.2 GB)
- Parakeet TDT v3 STT(114 种语言)、Kokoro 82M TTS(7 种语言)
- Silero VAD、DeepFilterNet3 降噪、barge-in 支持
Linux CLI Demo
构建并运行:
cd linux && cmake -B build && cmake --build build
./build/speech_demo --model-dir /path/to/models