ユースケース · コンテンツ制作

どんな声でも。
どんな長さでも。

音声合成の 3 つの形 —— 短い参照クリップから数秒で声をクローン、リアルタイム以上の速度で高品質なニュートラル TTS をレンダリング、1 時間規模のオーディオブックや多話者ポッドキャストを生成。すべてオンデバイス。

3 つのサブユースケース

合成の 3 つの種類。

パーソナライズされた声にはゼロショット・クローン、アプリ UI には高速ニュートラル TTS、ナレーションや対話には長尺。エンジンは違っても、同じオンデバイス・スタック。

さらに読む

コンポーネント別ガイド。