Demos
Speech Demo (Android)
Echo-Pipeline-Demo — Sprache transkribieren und wieder synthetisieren. Echtzeit-VAD-Wellenform-Visualisierung, Chatblasen-UI mit STT/TTS-Latenzanzeige.
Android 8+Parakeet TDTKokoroSilero VADDeepFilterNet3
Linux-CLI-Demo
Kommandozeilen-Sprach-Pipeline für eingebettetes Linux. ALSA-Mikrofoneingang oder stdin-PCM-Pipe.
Linux ARM64Linux x86_64ONNX Runtime
Android-Demo
Lade die vorgebaute APK (20 MB) herunter oder baue aus dem Quellcode:
app-release.apk (Signierte APK, 20 MB)- Modelle werden automatisch von HuggingFace heruntergeladen (~1,2 GB beim ersten Start)
- Parakeet TDT v3 STT (114 Sprachen), Kokoro 82M TTS (7 Sprachen)
- Silero VAD, DeepFilterNet3-Rauschunterdrückung, Barge-in-Unterstützung
Linux-CLI-Demo
Bauen und ausführen:
cd linux && cmake -B build && cmake --build build
./build/speech_demo --model-dir /path/to/models