Demos
Speech Demo (Android)
Demo de pipeline de eco — transcreva a fala e sintetize-a de volta. Visualizacao de waveform VAD em tempo real, interface de bolhas de chat com exibicao de latencia STT/TTS.
Android 8+Parakeet TDTKokoroSilero VADDeepFilterNet3
Demo CLI para Linux
Pipeline de fala em linha de comando para Linux embarcado. Entrada de microfone ALSA ou pipe PCM via stdin.
Linux ARM64Linux x86_64ONNX Runtime
Demo Android
Baixe o APK pre-compilado (20 MB) ou compile a partir do codigo-fonte:
app-release.apk (APK assinado, 20 MB)- Os modelos sao baixados automaticamente do HuggingFace (~1.2 GB no primeiro lancamento)
- Parakeet TDT v3 STT (114 idiomas), Kokoro 82M TTS (7 idiomas)
- Silero VAD, cancelamento de ruido DeepFilterNet3, suporte a barge-in
Demo CLI para Linux
Compilar e executar:
cd linux && cmake -B build && cmake --build build
./build/speech_demo --model-dir /path/to/models