ユースケース · オーディオブック · ポッドキャスト
何時間もの音声を。
一貫した一つの声で。
オーディオブックの章、ポッドキャストのエピソード、研修ナレーション —— Apple Silicon、Android、組み込み Linux 上でオンデバイス生成。自動セグメンテーションで数時間にわたり声を安定させ、複数話者モードで命名キャラ間の対話を扱います。
作れるもの
長尺の 5 つの形。
各エンジンに得意領域があります。オーディオブックはナレーターの忠実度で CosyVoice 3 が強い。多話者ポッドキャストはエピソード規模の文脈で VibeVoice。リアルタイム/ストリーミングは小型の VibeVoice Realtime。
オーディオブックの章
一貫したナレーターの声で章全体をレンダリング。文単位の自動分割で手動つなぎは不要。
多話者ポッドキャスト
インライン話者タグで話者交替を制御。脚本ありエピソードに 2〜4 人を起用。
ライブポッドキャスト / ストリーミング
聞き手が聞いている間に生成。VibeVoice Realtime はライブ会話に耐えるレイテンシ。
記事 TTS
ニュースレター記事、ブログ記事、社内ドキュメントを — スクリーンリーダー調ではなく自然なナレーションでレンダリング。
アクセシビリティ向けナレーション
視覚や活字に困難のある方への長尺コンテンツアクセス — 完全オフライン。
さらに読む
