Açık kaynak · Apache 2.0 · Tamamen çevrimdışı

Cihazda konuşma.
Gerçek ürünler için.

Konuşmacı ayrımlı transkripsiyon, sıfır-atışta ses klonlama, uzun biçimli konuşma sentezi — Apple Silicon, Android, Windows ve gömülü Linux üzerinde çalışır. Bulut API yok, dakika başına ücret yok, cihazdan veri çıkmaz.

Başla GitHub

Apple · Homebrew

brew install speech

Android · Gradle

implementation("audio.soniqo:speech:0.0.9")

Son blog yazıları

Gerçek ürünler için cihaz üzerinde konuşma.

Soniqo’dan benchmarklar, model notları ve yayınlama ayrıntıları.

Tüm yazılar

7 Temmuz 2026 · Soniqo Blog

İzle

MacBook üzerinde yerel Konuşma AI

Açık kaynak kütüphanenin dört dakikalık turu: Nemotron Streaming ile gerçek zamanlı transkripsiyon, PersonaPlex ile yerel speech-to-speech, VoxCPM2 ile 48 kHz ses klonlama — her demo dizüstü bilgisayarda çalışıyor.

YouTube'da izle

Neler inşa edebilirsiniz

Cihaz üzerinde üç kullanım grubu.

Her grup, Soniqo bileşenlerinden kurulan birkaç alt kullanım durumunu kapsar. Sesinizi verin; sohbet, transkript veya üretilmiş ses alın — yerel, gerçek zamanlı.

Sohbet

Ses ajanları

Ses öncelikli arayüzler kurun — tam çift yönlü speech-to-speech’ten uyandırma kelimesi tetiklemeli birleşik pipeline’lara kadar, hepsi yerel çalışır.

Learn more

Ses anlama

Konuşmadan metne

Sesi yapılandırılmış metne çevirin — canlı altyazı ve dikte için gerçek zamanlı akış, arşivler için yüksek doğruluklu toplu işlem, her konuşmacıyı adıyla işaretlemek için konuşmacı ayrımı.

Learn more

İçerik üretimi

Konuşma sentezi

Herhangi bir sesle konuşma sentezleyin — bir sesi saniyeler içinde klonlayın, saatlerce sesli kitap anlatın, çok konuşmacılı podcast üretin, tamamen çevrimdışı.

Learn more

Tüm bileşenler

Otuzdan fazla model. Tek bir stack.

Yukarıdaki kullanım pipeline’ları bu modellerden kurulur. Bir bileşeni seçin; mimarisini, CLI’sini, Swift API’sini ve benchmarklarını okuyun. Hepsi Apple Silicon’da, çoğu Android ve Linux’ta da çalışır.

Konuşmadan metne

Qwen3-ASR

52 langs, RTF 0.06, 4-/8-bit

Cihazda konuşma.Gerçek ürünler için.

Gerçek ürünler için cihaz üzerinde konuşma.

Cihazda sesli ajanlar: tek bir pipeline, üç bellek bütçesi

Ses klonlama modelleri, beş dilde ölçüldü

VoxCPM2 ile bir sesi 48 kHz’de klonlama

MacBook üzerinde yerel Konuşma AI

Cihaz üzerinde üç kullanım grubu.

Ses ajanları

Konuşmadan metne

Konuşma sentezi

Otuzdan fazla model. Tek bir stack.

Konuşmadan metne

Metinden konuşmaya

Ses analizi

Müzik ve ses üretimi

LLM ve Speech-to-speech

Cihazda konuşma.
Gerçek ürünler için.