ユースケース · オーディオブック · ポッドキャスト

何時間もの音声を。
一貫した一つの声で。

オーディオブックの章、ポッドキャストのエピソード、研修ナレーション —— Apple Silicon、Android、組み込み Linux 上でオンデバイス生成。自動セグメンテーションで数時間にわたり声を安定させ、複数話者モードで命名キャラ間の対話を扱います。

作れるもの

長尺の 5 つの形。

各エンジンに得意領域があります。オーディオブックはナレーターの忠実度で CosyVoice 3 が強い。多話者ポッドキャストはエピソード規模の文脈で VibeVoice。リアルタイム/ストリーミングは小型の VibeVoice Realtime。

オーディオブックの章

一貫したナレーターの声で章全体をレンダリング。文単位の自動分割で手動つなぎは不要。

多話者ポッドキャスト

インライン話者タグで話者交替を制御。脚本ありエピソードに 2〜4 人を起用。

ライブポッドキャスト / ストリーミング

聞き手が聞いている間に生成。VibeVoice Realtime はライブ会話に耐えるレイテンシ。

記事 TTS

ニュースレター記事、ブログ記事、社内ドキュメントを — スクリーンリーダー調ではなく自然なナレーションでレンダリング。

アクセシビリティ向けナレーション

視覚や活字に困難のある方への長尺コンテンツアクセス — 完全オフライン。

さらに読む

コンポーネント別ガイド。