Caso de uso · Conversacional

Voz entra.
Voz sale.

Tres formas de interfaces voice-first — un único modelo speech-to-speech full-duplex, un pipeline compositivo wake → VAD → ASR → LLM → TTS que controlas por completo, y activación por palabra clave para entrada manos libres. Todo en el dispositivo, sin APIs en la nube, sin audio saliendo del dispositivo.

Apps de escritorio

Studio crea voces. Runner conversa con ellas.

Speech Studio y Runner son dos caras de la misma pila local de voz: una para producción de voces y otra para interacción en vivo con agentes de voz.

Tres subcasos de uso

Elige la forma que encaja con tu producto.

Modelo de diálogo plug-and-play, pipeline compositivo con control por etapa, o un disparador delgado por palabra clave. Cada uno corre íntegramente en el dispositivo.

Lectura adicional

Guías de componentes.