Horas de áudio.
Uma voz consistente.
Capítulos de audiolivros, episódios de podcast, narração de treinamento — renderizados no dispositivo em Apple Silicon, Android ou Linux embarcado. A segmentação automática mantém a voz estável por horas; o modo multi-locutor gerencia diálogos entre personagens nomeados.
Cinco formatos longos.
Cada motor tem seu ponto forte. Audiolivros dependem do CosyVoice 3 pela fidelidade do narrador. Podcasts multi-locutor dependem do VibeVoice por seu contexto de episódio. Streaming em tempo real usa o VibeVoice Realtime menor.
Passagens de capítulo inteiro com uma voz de narrador consistente. Segmentação automática por frase, sem costura manual.
Tags inline de locutor controlam a alternância. Distribua de duas a quatro vozes em um episódio roteirizado.
Gere enquanto o ouvinte ouve. VibeVoice Realtime mantém a latência baixa o suficiente para conversas ao vivo.
Artigos de newsletter, posts de blog, docs internos — renderizados como narração natural, sem o ritmo de leitor de tela.
Acesso a conteúdo longo para pessoas com deficiência visual ou de leitura, totalmente offline.
