ユースケース · コンテンツ制作
どんな声でも。
どんな長さでも。
音声合成の 3 つの形 —— 短い参照クリップから数秒で声をクローン、リアルタイム以上の速度で高品質なニュートラル TTS をレンダリング、1 時間規模のオーディオブックや多話者ポッドキャストを生成。すべてオンデバイス。
3 つのサブユースケース
合成の 3 つの種類。
パーソナライズされた声にはゼロショット・クローン、アプリ UI には高速ニュートラル TTS、ナレーションや対話には長尺。エンジンは違っても、同じオンデバイス・スタック。
さらに読む
