Демо
Speech Demo (Android)
Демо echo-пайплайна — транскрибирует речь и синтезирует её обратно. Визуализация waveform VAD в реальном времени, интерфейс с пузырьками чата и отображением задержек STT/TTS.
Android 8+Parakeet TDTKokoroSilero VADDeepFilterNet3
Linux CLI Demo
Речевой пайплайн с командной строкой для встраиваемого Linux. Ввод с ALSA-микрофона или PCM через stdin.
Linux ARM64Linux x86_64ONNX Runtime
Android-демо
Скачайте готовый APK (20 МБ) или соберите из исходников:
app-release.apk (подписанный APK, 20 МБ)- Модели автоматически скачиваются с HuggingFace (~1.2 ГБ при первом запуске)
- Parakeet TDT v3 STT (114 языков), Kokoro 82M TTS (7 языков)
- Silero VAD, подавление шума DeepFilterNet3, поддержка barge-in
Linux CLI Demo
Сборка и запуск:
cd linux && cmake -B build && cmake --build build
./build/speech_demo --model-dir /path/to/models