Horas de audio.
Una voz consistente.
Capítulos de audiolibros, episodios de podcast, narración de formación — renderizado en el dispositivo en Apple Silicon, Android o Linux embebido. La segmentación automática mantiene la voz estable durante horas; el modo multi-locutor gestiona el diálogo entre personajes nombrados.
Cinco formas de larga duración.
Cada motor tiene su punto óptimo. Los audiolibros se apoyan en CosyVoice 3 para la fidelidad del narrador. Los podcasts multi-locutor se apoyan en VibeVoice por su contexto a nivel de episodio. Para streaming en tiempo real se usa el VibeVoice Realtime más pequeño.
Pasadas de capítulo completo con una voz de narrador consistente. Segmentación automática a nivel de frase, sin cosido manual.
Las etiquetas inline de hablante guían el cambio de turnos. Dos a cuatro voces para un episodio guionizado.
Genera mientras el oyente escucha. VibeVoice Realtime mantiene la latencia lo bastante baja para conversaciones en vivo.
Artículos de newsletter, posts de blog, docs internos — renderizados como narración natural sin el ritmo de un lector de pantalla.
Acceso a contenido largo para usuarios con discapacidad visual o de impresión, totalmente offline.
