حالة استخدام · محادثة
صوت يدخل.
صوت يخرج.
ثلاث صور لواجهات تعتمد على الصوت — نموذج واحد كلام-إلى-كلام ثنائي الاتجاه، خط أنابيب تركيبي wake → VAD → ASR → LLM → TTS تتحكّم فيه بالكامل، وتفعيل بكلمة استيقاظ للإدخال دون يدين. كله على الجهاز، بدون واجهات سحابية، وبدون خروج صوت.
ثلاث حالات استخدام فرعية
اختر الصورة التي تناسب منتجك.
نموذج حوار جاهز للتشغيل، أو خط أنابيب تركيبي بتحكّم لكل مرحلة، أو مُحفِّز كلمة استيقاظ نحيف. كلٌّ منها يعمل بالكامل على الجهاز.
كلام إلى كلام ثنائي الاتجاه كامل
نموذج واحد يأخذ إدخال المايكروفون ويخرج كلاماً. WebSocket متوافق مع OpenAI-Realtime بإسقاط مباشر؛ كود قليل، داخل غير شفّاف.
خط أنابيب صوتي تركيبي
كلمة استيقاظ → VAD → ASR بالبث → LLM على الجهاز → TTS. تحكّم لكل مرحلة، رؤية للنص، محرّكات قابلة للتبديل. ابنِ Siri الخاص بك.
تفعيل بكلمة استيقاظ
مُحفِّز دون يدين لأي تدفق صوتي. كلمات استيقاظ مخصّصة بعتبات لكل عبارة، أقل من 5 ميغابايت على الجهاز، 26× الزمن الحقيقي.
قراءة معمّقة
