Часы аудио.
Один и тот же голос.
Главы аудиокниг, эпизоды подкастов, обучающая озвучка — рендерятся на устройстве на Apple Silicon, Android или embedded Linux. Автоматическая сегментация удерживает голос стабильным часами; режим многих спикеров обрабатывает диалоги именованных персонажей.
Пять форматов длинного аудио.
У каждого движка свой конёк. Аудиокниги опираются на CosyVoice 3 за счёт верности диктора. Многоголосые подкасты — на VibeVoice за счёт эпизодического контекста. Real-time / стриминг — на меньшую модель VibeVoice Realtime.
Полные прогоны главы с одним и тем же диктором. Автоматическая сегментация по предложениям, без ручной склейки.
Инлайн-теги спикеров управляют сменой реплик. Сложите два-четыре голоса в эпизод по сценарию.
Генерируйте, пока слушатель слушает. VibeVoice Realtime держит задержку достаточно низкой для живых диалогов.
Статьи длиной с рассылку, посты в блог, внутренние документы — отрендерены как естественная речь, без интонаций скринридера.
Доступ к длинному контенту для пользователей с печатными или зрительными ограничениями — полностью офлайн.
