Caso de uso · Criação de conteúdo

Qualquer voz.
Qualquer duração.

Três formas de geração de voz — clone uma voz em segundos a partir de um clipe curto, renderize TTS neutro de alta qualidade mais rápido que tempo real, ou produza audiolivros de uma hora e podcasts multi-locutor. Tudo no dispositivo.

Começar Guia de clonagem de voz

Três subcasos de uso

Três sabores de síntese.

Clonagem zero-shot para vozes personalizadas, TTS neutro rápido para UI de app, ou longa duração para narração e diálogo. Motores diferentes, a mesma stack no dispositivo.

Clonagem de voz

Clone uma voz a partir de um clipe de 5–30 s. Zero-shot, sem fine-tuning, em nove idiomas.

TTS padrão

Voz neutra de alta qualidade, mais rápida que tempo real. Bundles compactos para UI de app, acessibilidade e narração in-app.

Longa duração & multi-locutor

Capítulos de audiolivro com um narrador consistente, ou podcasts multi-locutor de até 90 min com tags inline de locutor.

Leitura adicional