用例 · 内容创作

任意声音。
任意长度。

语音合成的三种形态 —— 用一小段参考片段在几秒内克隆一个声音,以快于实时的速度渲染高质量中性 TTS,或产出一小时长的有声书与多说话人播客。全部端侧完成。

三个子用例

三种合成风味。

为个性化嗓音做零样本克隆、为应用 UI 做快速中性 TTS,或为旁白和对话做长篇合成。不同引擎,同一套端侧技术栈。

深入阅读

组件指南。