Demos
Speech Demo (Android)
Demo de pipeline de eco — transcribe el habla y la sintetiza de vuelta. Visualización en tiempo real de la forma de onda del VAD, interfaz con burbujas de chat y visualización de latencia STT/TTS.
Android 8+Parakeet TDTKokoroSilero VADDeepFilterNet3
Demo CLI de Linux
Pipeline de voz por línea de comandos para Linux embebido. Entrada desde micrófono ALSA o por tubería PCM en stdin.
Linux ARM64Linux x86_64ONNX Runtime
Demo de Android
Descarga el APK precompilado (20 MB) o compílalo desde el código fuente:
app-release.apk (APK firmado, 20 MB)- Los modelos se descargan automáticamente desde HuggingFace (~1.2 GB en el primer arranque)
- Parakeet TDT v3 STT (114 idiomas), Kokoro 82M TTS (7 idiomas)
- Silero VAD, cancelación de ruido con DeepFilterNet3, soporte para barge-in
Demo CLI de Linux
Compilar y ejecutar:
cd linux && cmake -B build && cmake --build build
./build/speech_demo --model-dir /path/to/models