Caso de uso · Creación de contenido

Cualquier voz.
Cualquier duración.

Tres formas de generación de voz — clona una voz en segundos a partir de un clip corto, renderiza TTS neutro de alta calidad más rápido que en tiempo real, o produce audiolibros de una hora y podcasts multi-locutor. Todo en el dispositivo.

Tres subcasos de uso

Tres sabores de síntesis.

Clonación zero-shot para voces personalizadas, TTS neutro rápido para UI de app, o larga duración para narración y diálogo. Motores distintos, el mismo stack en el dispositivo.

Lectura adicional

Guías de componentes.