用例 · 对话式
声音进。
声音出。
三种以语音为先的界面形态 —— 一个全双工 speech-to-speech 模型,一条由你完全掌控的 wake → VAD → ASR → LLM → TTS 可组合流水线,以及用于免手操作启动的唤醒词激活。全部端侧运行,无云端 API,音频不离开设备。
桌面应用
Studio 创建声音。Runner 用声音对话。
Speech Studio 和 Runner 是同一本地语音栈的两个界面:一个用于语音制作,一个用于实时语音代理交互。
三个子用例
挑选最契合你产品的形态。
即插即用的对话模型、可逐级控制的可组合流水线,或一个轻量的唤醒词触发器。每一种都完全在设备端运行。
深入阅读
