مفتوح المصدر · Apache 2.0 · يعمل دون اتصال بالإنترنت

الكلام على الجهاز.
لمنتجات حقيقية.

تفريغ مع تحديد المتحدّثين، واستنساخ صوت بصفر-إطلاق، وتركيب كلام طويل المدى — يعمل على Apple Silicon وAndroid وWindows وLinux المضمّن. بدون واجهات سحابية، بدون تسعير بالدقيقة، وبدون خروج أي بيانات من الجهاز.

ابدأ GitHub

Apple · Homebrew

brew install speech

Android · Gradle

implementation("audio.soniqo:speech:0.0.9")

أحدث مقالات المدونة

الخطاب على الجهاز لمنتجات حقيقية.

قياسات أداء وملاحظات نماذج وتفاصيل إطلاق من Soniqo.

كل المنشورات

7 يوليو 2026 · مدوّنة Soniqo

شاهد

الذكاء الصوتي المحلّي على MacBook

جولة من أربع دقائق في المكتبة مفتوحة المصدر: تفريغ زمن حقيقي مع Nemotron Streaming، كلام إلى كلام محلّي مع PersonaPlex، واستنساخ صوت بدقة 48 كيلوهرتز مع VoxCPM2 — كل العروض تعمل على الحاسوب المحمول.

شاهد على YouTube

ما يمكنك بناؤه

ثلاث مجموعات حالات استخدام على الجهاز.

كل مجموعة تغطّي عدة حالات فرعية مبنية من مكوّنات Soniqo. مرّر صوتك واحصل على محادثة أو نصوص أو صوت مُولَّد — محلياً وفي الزمن الحقيقي.

محادثة

وكلاء صوتيون

ابنِ واجهات تعتمد على الصوت — من نموذج كلام إلى كلام ثنائي الاتجاه كامل إلى خطوط أنابيب تركيبية مُفعَّلة بكلمة استيقاظ، تعمل كلها محلياً.

Learn more

فهم الصوت

تفريغ النصوص

حوِّل الصوت إلى نص منظَّم — بثّ زمن حقيقي للترجمة الفورية والإملاء، ودقة عالية بالدُفعات للأرشيف، مع تحديد كل متحدّث بالاسم.

Learn more

إنشاء المحتوى

توليد الكلام

ركِّب الكلام بأي صوت — استنسخ صوتاً في ثوانٍ، أو اقرأ كتباً صوتية لساعات، أو أنتج بودكاست متعدّد المتحدّثين، كل ذلك دون اتصال بالإنترنت.

Learn more

كل المكوّنات

أكثر من ثلاثين نموذجاً. حزمة واحدة.

خطوط الأنابيب المعروضة أعلاه مبنية من هذه النماذج. اختر مكوّناً لترى بنيته وواجهة سطر الأوامر وSwift API ونتائج الأداء. كلها تعمل على Apple Silicon، ومعظمها على Android وLinux أيضاً.

صوت إلى نص

Qwen3-ASR

52 langs, RTF 0.06, 4-/8-bit

الكلام على الجهاز.لمنتجات حقيقية.

الخطاب على الجهاز لمنتجات حقيقية.

تشغيل وكيل صوتي على الجهاز: خط أنابيب واحد، ثلاث ميزانيات ذاكرة

نماذج استنساخ الصوت، مقيسة عبر خمس لغات

استنساخ صوت بدقة 48 كيلوهرتز مع VoxCPM2

الذكاء الصوتي المحلّي على MacBook

ثلاث مجموعات حالات استخدام على الجهاز.

وكلاء صوتيون

تفريغ النصوص

توليد الكلام

أكثر من ثلاثين نموذجاً. حزمة واحدة.

صوت إلى نص

نص إلى صوت

تحليل الصوت

الموسيقى وإنتاج الصوت

LLM وكلام إلى كلام

الكلام على الجهاز.
لمنتجات حقيقية.