Caso de uso · Criação de conteúdo
Qualquer voz.
Qualquer duração.
Três formas de geração de voz — clone uma voz em segundos a partir de um clipe curto, renderize TTS neutro de alta qualidade mais rápido que tempo real, ou produza audiolivros de uma hora e podcasts multi-locutor. Tudo no dispositivo.
Três subcasos de uso
Três sabores de síntese.
Clonagem zero-shot para vozes personalizadas, TTS neutro rápido para UI de app, ou longa duração para narração e diálogo. Motores diferentes, a mesma stack no dispositivo.
Clonagem de voz
Clone uma voz a partir de um clipe de 5–30 s. Zero-shot, sem fine-tuning, em nove idiomas.
TTS padrão
Voz neutra de alta qualidade, mais rápida que tempo real. Bundles compactos para UI de app, acessibilidade e narração in-app.
Longa duração & multi-locutor
Capítulos de audiolivro com um narrador consistente, ou podcasts multi-locutor de até 90 min com tags inline de locutor.
Leitura adicional
