开源 · Apache 2.0 · 完全离线
端侧语音。
面向真实产品。
说话人分离的转录、零样本声音克隆、长篇语音合成 —— 在 Apple Silicon、Android 和嵌入式 Linux 上运行。无云端 API、无按分钟计费、数据从不离开设备。
Apple · Homebrew
brew install soniqo/tap/speechAndroid · Gradle
implementation("audio.soniqo:speech:0.0.5")观看
在 MacBook 上运行的本地语音 AI
四分钟开源库导览:Nemotron Streaming 实时转录、PersonaPlex 本地语音对话,以及 VoxCPM2 48 kHz 语音克隆 —— 所有演示都在本地笔记本上运行。
在 YouTube 上观看你能构建什么
三大端侧使用场景分组。
每个分组都涵盖多个由 Soniqo 组件拼接而成的子场景。投入音频,即可在本地、实时获得对话、转录或合成语音。
全部组件
二十多个模型。一个技术栈。
上面的用例流水线全部由这些模型拼接而成。点击组件查看其架构、CLI、Swift API 与基准测试。全部支持 Apple Silicon,多数也支持 Android 与 Linux。
语音转文字
文字转语音
CosyVoice 3
9 langs, zero-shot cloning, 4-bit → bf16
MLX
Qwen3-TTS
12 Hz codec LM, faster than real-time
MLX
CoreML
VoxCPM2
48 kHz, 30 langs, voice design + cloning
MLX
Kokoro 82M
50 voices, ~45 ms inference
CoreML
ONNX
VibeVoice
90-min podcasts / audiobooks
MLX
Magpie 357M
9 langs, 5 baked voices, streaming
MLX
Voice Cloning Suite
CosyVoice, Qwen3-TTS ICL, CAM++
MLX
