Cihazda konuşma.
Gerçek ürünler için.
Konuşmacı ayrımlı transkripsiyon, sıfır-atışta ses klonlama, uzun biçimli konuşma sentezi — Apple Silicon, Android ve gömülü Linux üzerinde çalışır. Bulut API yok, dakika başına ücret yok, cihazdan veri çıkmaz.
brew install soniqo/tap/speechimplementation("audio.soniqo:speech:0.0.5")MacBook üzerinde yerel Konuşma AI
Açık kaynak kütüphanenin dört dakikalık turu: Nemotron Streaming ile gerçek zamanlı transkripsiyon, PersonaPlex ile yerel speech-to-speech, VoxCPM2 ile 48 kHz ses klonlama — her demo dizüstü bilgisayarda çalışıyor.
YouTube'da izleCihaz üzerinde üç kullanım grubu.
Her grup, Soniqo bileşenlerinden kurulan birkaç alt kullanım durumunu kapsar. Sesinizi verin; sohbet, transkript veya üretilmiş ses alın — yerel, gerçek zamanlı.
Ses ajanları
Ses öncelikli arayüzler kurun — tam çift yönlü speech-to-speech’ten uyandırma kelimesi tetiklemeli birleşik pipeline’lara kadar, hepsi yerel çalışır.
Konuşmadan metne
Sesi yapılandırılmış metne çevirin — canlı altyazı ve dikte için gerçek zamanlı akış, arşivler için yüksek doğruluklu toplu işlem, her konuşmacıyı adıyla işaretlemek için konuşmacı ayrımı.
Konuşma sentezi
Herhangi bir sesle konuşma sentezleyin — bir sesi saniyeler içinde klonlayın, saatlerce sesli kitap anlatın, çok konuşmacılı podcast üretin, tamamen çevrimdışı.
Yirmiden fazla model. Tek bir stack.
Yukarıdaki kullanım pipeline’ları bu modellerden kurulur. Bir bileşeni seçin; mimarisini, CLI’sini, Swift API’sini ve benchmarklarını okuyun. Hepsi Apple Silicon’da, çoğu Android ve Linux’ta da çalışır.
Konuşmadan metne
Metinden konuşmaya
9 langs, zero-shot cloning, 4-bit → bf16
12 Hz codec LM, faster than real-time
48 kHz, 30 langs, voice design + cloning
50 voices, ~45 ms inference
90-min podcasts / audiobooks
9 langs, 5 baked voices, streaming
CosyVoice, Qwen3-TTS ICL, CAM++
