Open source · Apache 2.0 · Полностью офлайн

Речь на устройстве.
Для реальных продуктов.

Диаризованная транскрипция, zero-shot клонирование голоса, длинный синтез речи — на Apple Silicon, Android и embedded Linux. Никаких облачных API, никакой оплаты по минутам, никакие данные не покидают устройство.

Apple · Homebrew
brew install soniqo/tap/speech
Android · Gradle
implementation("audio.soniqo:speech:0.0.5")
Смотреть

Локальный речевой ИИ на MacBook

Четырёхминутный обзор open source библиотеки: транскрипция в реальном времени с Nemotron Streaming, локальный speech-to-speech с PersonaPlex и клонирование голоса 48 кГц с VoxCPM2 — все демо работают прямо на ноутбуке.

Смотреть на YouTube
Что можно построить

Три группы сценариев — все на устройстве.

Каждая группа охватывает несколько подсценариев, собранных из компонентов Soniqo. Подаёте аудио — получаете диалог, транскрипции или сгенерированную речь локально, в реальном времени.

Все компоненты

Более двадцати моделей. Один стек.

Все пайплайны выше собраны из этих моделей. Выберите компонент, чтобы увидеть его архитектуру, CLI, Swift API и бенчмарки. Все работают на Apple Silicon, большинство — также на Android и Linux.