ユースケース · コンテンツ制作
30 秒で声をクローン。
何時間でも合成。
Apple Silicon 上でのゼロショット音声クローン。5〜30 秒の参照クリップとその文字起こしを与えるだけで、CosyVoice 3 がそのままの声で 9 言語の音声を生成 —— 完全オフライン。ファインチューニング不要、文字単位の課金なし、音声はデバイスから出ません。
作れるもの
音声クローンの 5 つのレシピ。
いずれのレシピも合成は CosyVoice 3 に任せ、前後処理を入れ替えます — マッチングには話者埋め込み、参照を綺麗にするにはノイズ除去、音声のみのときは Qwen3-TTS ICL。
オーディオブック・ナレーション
著者や好みの声を一度クローンすれば、何時間も一貫したナレーションを生成。
吹き替え & ローカライズ
翻訳トラック上でプレゼンターの声を維持。9 言語対応。
キャラクターボイス
インラインの話者タグでシーンごとに 2〜4 のカスタム音声。
パーソナル TTS
自然に話せなくなった方のために、なじみの声を取り戻す。
ブランドボイス
製品ライン全体で一貫した単一のナレーター。
さらに読む
