Cas d’usage · Conversationnel

Voix en entrée.
Voix en sortie.

Trois formes d’interfaces voice-first — un unique modèle speech-to-speech full-duplex, un pipeline composable wake → VAD → ASR → LLM → TTS que vous contrôlez entièrement, et une activation par mot-clé pour une entrée mains libres. Tout sur l’appareil, aucune API cloud, aucun audio ne quitte l’appareil.

Apps desktop

Studio crée des voix. Runner dialogue avec elles.

Speech Studio et Runner sont deux faces de la même pile vocale locale : l’une pour produire des voix, l’autre pour l’interaction en direct avec un agent vocal.

Trois sous-cas d’usage

Choisissez la forme qui colle à votre produit.

Modèle de dialogue clé en main, pipeline composable avec contrôle par étape, ou simple déclencheur par mot-clé. Chaque option tourne entièrement sur l’appareil.

Pour aller plus loin

Guides des composants.