Démos
Speech Demo (Android)
Démo de pipeline d'écho — transcrit la parole et la resynthétise. Visualisation de forme d'onde VAD en temps réel, interface en bulles de chat avec affichage de latence STT/TTS.
Android 8+Parakeet TDTKokoroSilero VADDeepFilterNet3
Démo CLI Linux
Pipeline vocal en ligne de commande pour Linux embarqué. Entrée micro ALSA ou pipe PCM via stdin.
Linux ARM64Linux x86_64ONNX Runtime
Démo Android
Téléchargez l'APK pré-compilé (20 Mo) ou compilez depuis les sources :
app-release.apk (APK signé, 20 Mo)- Les modèles se téléchargent automatiquement depuis HuggingFace (~1,2 Go au premier lancement)
- Parakeet TDT v3 STT (114 langues), Kokoro 82M TTS (7 langues)
- Silero VAD, suppression de bruit DeepFilterNet3, support du barge-in
Démo CLI Linux
Compilation et exécution :
cd linux && cmake -B build && cmake --build build
./build/speech_demo --model-dir /path/to/models