حالة استخدام · محادثة

صوت يدخل.
صوت يخرج.

ثلاث صور لواجهات تعتمد على الصوت — نموذج واحد كلام-إلى-كلام ثنائي الاتجاه، خط أنابيب تركيبي wake → VAD → ASR → LLM → TTS تتحكّم فيه بالكامل، وتفعيل بكلمة استيقاظ للإدخال دون يدين. كله على الجهاز، بدون واجهات سحابية، وبدون خروج صوت.

ابدأ دليل كلام إلى كلام

تطبيقات سطح المكتب

Studio يصنع الأصوات. Runner يتحدث بها.

Speech Studio وRunner وجهان لنفس مكدس الصوت المحلي: أحدهما لإنتاج الأصوات، والآخر لتفاعل وكيل صوتي مباشر.

Runner Agent

يشغّل محليًا الحلقة الكاملة من الميكروفون إلى الرفيق الصوتي، مع نسخة معاينة تستهدف ميزانية ذاكرة صغيرة على Apple Silicon.

جرّب Runner

Speech Studio

استنسخ الأصوات، قارن العينات، وأنشئ كلامًا متعدد المتحدثين محليًا على Mac.

فتح Speech Studio

ثلاث حالات استخدام فرعية

اختر الصورة التي تناسب منتجك.

نموذج حوار جاهز للتشغيل، أو خط أنابيب تركيبي بتحكّم لكل مرحلة، أو مُحفِّز كلمة استيقاظ نحيف. كلٌّ منها يعمل بالكامل على الجهاز.

كلام إلى كلام ثنائي الاتجاه كامل

نموذج واحد يأخذ إدخال المايكروفون ويخرج كلاماً. WebSocket متوافق مع OpenAI-Realtime بإسقاط مباشر؛ كود قليل، داخل غير شفّاف.

خط أنابيب صوتي تركيبي

كلمة استيقاظ → VAD → ASR بالبث → LLM على الجهاز → TTS. تحكّم لكل مرحلة، رؤية للنص، محرّكات قابلة للتبديل. ابنِ Siri الخاص بك.

تفعيل بكلمة استيقاظ

مُحفِّز دون يدين لأي تدفق صوتي. كلمات استيقاظ مخصّصة بعتبات لكل عبارة، أقل من 5 ميغابايت على الجهاز، 26× الزمن الحقيقي.

قراءة معمّقة

أدلّة المكوّنات.

PersonaPlex 7B

Qwen3.5 Chat

Streaming Dictation

Voice Activity Detection

Wake-Word / KWS

speech-server

صوت يدخل.صوت يخرج.

Studio يصنع الأصوات. Runner يتحدث بها.

اختر الصورة التي تناسب منتجك.

أدلّة المكوّنات.

صوت يدخل.
صوت يخرج.