用例 · 对话式

声音进。
声音出。

三种以语音为先的界面形态 —— 一个全双工 speech-to-speech 模型,一条由你完全掌控的 wake → VAD → ASR → LLM → TTS 可组合流水线,以及用于免手操作启动的唤醒词激活。全部端侧运行,无云端 API,音频不离开设备。

桌面应用

Studio 创建声音。Runner 用声音对话。

Speech Studio 和 Runner 是同一本地语音栈的两个界面:一个用于语音制作,一个用于实时语音代理交互。

三个子用例

挑选最契合你产品的形态。

即插即用的对话模型、可逐级控制的可组合流水线,或一个轻量的唤醒词触发器。每一种都完全在设备端运行。

深入阅读

组件指南。