데모
Speech Demo (Android)
에코 파이프라인 데모 — 음성을 전사하고 다시 합성합니다. 실시간 VAD 파형 시각화, STT/TTS 지연을 표시하는 채팅 버블 UI.
Android 8+Parakeet TDTKokoroSilero VADDeepFilterNet3
Linux CLI 데모
임베디드 Linux를 위한 명령행 음성 파이프라인. ALSA 마이크 입력 또는 stdin PCM 파이프.
Linux ARM64Linux x86_64ONNX Runtime
Android 데모
사전 빌드된 APK (20 MB)를 다운로드하거나 소스에서 빌드하세요:
app-release.apk (서명된 APK, 20 MB)- 모델은 HuggingFace에서 자동 다운로드됩니다 (최초 실행 시 약 1.2 GB)
- Parakeet TDT v3 STT (114개 언어), Kokoro 82M TTS (7개 언어)
- Silero VAD, DeepFilterNet3 노이즈 제거, barge-in 지원
Linux CLI 데모
빌드 및 실행:
cd linux && cmake -B build && cmake --build build
./build/speech_demo --model-dir /path/to/models