ユースケース · コンテンツ制作

30 秒で声をクローン。
何時間でも合成。

Apple Silicon 上でのゼロショット音声クローン。5〜30 秒の参照クリップとその文字起こしを与えるだけで、CosyVoice 3 がそのままの声で 9 言語の音声を生成 —— 完全オフライン。ファインチューニング不要、文字単位の課金なし、音声はデバイスから出ません。

作れるもの

音声クローンの 5 つのレシピ。

いずれのレシピも合成は CosyVoice 3 に任せ、前後処理を入れ替えます — マッチングには話者埋め込み、参照を綺麗にするにはノイズ除去、音声のみのときは Qwen3-TTS ICL。

オーディオブック・ナレーション

著者や好みの声を一度クローンすれば、何時間も一貫したナレーションを生成。

吹き替え & ローカライズ

翻訳トラック上でプレゼンターの声を維持。9 言語対応。

キャラクターボイス

インラインの話者タグでシーンごとに 2〜4 のカスタム音声。

パーソナル TTS

自然に話せなくなった方のために、なじみの声を取り戻す。

ブランドボイス

製品ライン全体で一貫した単一のナレーター。

さらに読む

コンポーネント別ガイド。