Caso de uso · Criação de conteúdo

Qualquer voz.
Qualquer duração.

Três formas de geração de voz — clone uma voz em segundos a partir de um clipe curto, renderize TTS neutro de alta qualidade mais rápido que tempo real, ou produza audiolivros de uma hora e podcasts multi-locutor. Tudo no dispositivo.

Três subcasos de uso

Três sabores de síntese.

Clonagem zero-shot para vozes personalizadas, TTS neutro rápido para UI de app, ou longa duração para narração e diálogo. Motores diferentes, a mesma stack no dispositivo.

Leitura adicional

Guias dos componentes.