Кейс · Аудиокниги · Подкасты

Часы аудио.
Один и тот же голос.

Главы аудиокниг, эпизоды подкастов, обучающая озвучка — рендерятся на устройстве на Apple Silicon, Android или embedded Linux. Автоматическая сегментация удерживает голос стабильным часами; режим многих спикеров обрабатывает диалоги именованных персонажей.

Что можно построить

Пять форматов длинного аудио.

У каждого движка свой конёк. Аудиокниги опираются на CosyVoice 3 за счёт верности диктора. Многоголосые подкасты — на VibeVoice за счёт эпизодического контекста. Real-time / стриминг — на меньшую модель VibeVoice Realtime.

Главы аудиокниг

Полные прогоны главы с одним и тем же диктором. Автоматическая сегментация по предложениям, без ручной склейки.

Многоголосые подкасты

Инлайн-теги спикеров управляют сменой реплик. Сложите два-четыре голоса в эпизод по сценарию.

Подкаст в прямом эфире / стриминг

Генерируйте, пока слушатель слушает. VibeVoice Realtime держит задержку достаточно низкой для живых диалогов.

TTS статей

Статьи длиной с рассылку, посты в блог, внутренние документы — отрендерены как естественная речь, без интонаций скринридера.

Доступная озвучка

Доступ к длинному контенту для пользователей с печатными или зрительными ограничениями — полностью офлайн.

Глубже

Гайды по компонентам.