Speech Studio

Open-source Mac-приложение для локального клонирования голоса и генерации диалогов с несколькими спикерами. Перетащите образец голоса, клонируйте, напишите сцену, синтезируйте — всё на вашем ноутбуке. Без API-ключей, без облака, без оплаты за символы.

30-секундный слепой тест: реальный голос, тот же голос, клонированный локально Speech Studio на MacBook, и тот же голос, клонированный ElevenLabs в облаке. Сможете отличить?

Что умеет

Требования

Установка

Скачайте свежий .dmg с GitHub Releases, откройте его, перетащите Speech Studio в /Applications и запустите:

При первом запуске macOS Gatekeeper предупредит, что разработчик не верифицирован — откройте через Системные настройки → Конфиденциальность и безопасность → Открыть всё равно до появления нотаризованных сборок. Также при первом запуске скачается ~2,75 ГБ весов VoxCPM2 с HuggingFace в ~/.cache/huggingface/hub/; последующие запуски используют кэш.

Предпочитаете CLI?

Тот же конвейер клонирования есть в CLI speech: brew install soniqo/tap/speech, затем speech speak --engine voxcpm2 --voxcpm2-ref-audio reference.wav -o cloned.wav "Hello, this is my cloned voice." — удобно для скриптов и батч-предрендеринга. Полный поток смотрите в руководстве по клонированию голоса.

Статус

Speech Studio в активном превью (v0.0.2). Репозиторий github.com/soniqo/speech-studio отслеживает GUI-приложение; поставьте star/watch, чтобы получать уведомления о нотаризованных релизах. Сборки для Linux и Windows сегодня компилируются через движок LiteRT VoxCPM2 в speech-core; on-device runtime подключён, но ещё не валидирован на железе.

На чём построено

Speech Studio — тонкий GUI поверх speech-swift, open-source Swift-библиотеки, в которой собраны все модели из демо:

Roadmap

Обратная связь

Открывайте issue на github.com/soniqo/speech-studio/issues — каждое читается.