Кейс · Создание контента

Клонируйте голос за 30 секунд.
Синтезируйте часами.

Zero-shot клонирование голоса на Apple Silicon. Дайте 5–30-секундный референс с транскриптом; CosyVoice 3 синтезирует речь в этом голосе на девяти языках, полностью офлайн. Без fine-tuning, без оплаты за символ, аудио никогда не покидает устройство.

Что можно построить

Пять рецептов клонирования голоса.

Каждый рецепт строится на CosyVoice 3 для синтеза, но смешивает разные пред-/постобработки — эмбеддинги спикеров для подбора, шумоподавление для чистого референса, Qwen3-TTS ICL, когда у вас только аудио.

Озвучка аудиокниг

Клонируйте автора или выбранный голос один раз и рендерите часы согласованной озвучки.

Дубляж и локализация

Сохраните голос ведущего на переведённых дорожках, на девяти языках.

Голоса персонажей

От двух до четырёх кастомных голосов на сцену через инлайн-теги спикеров.

Персональный TTS

Вернуть знакомый голос пользователям, которые больше не могут говорить естественно.

Бренд-голос

Один и тот же диктор во всей продуктовой линейке.

Глубже

Гайды по компонентам.