Caso de uso · Audiolibros · Podcasts

Horas de audio.
Una voz consistente.

Capítulos de audiolibros, episodios de podcast, narración de formación — renderizado en el dispositivo en Apple Silicon, Android o Linux embebido. La segmentación automática mantiene la voz estable durante horas; el modo multi-locutor gestiona el diálogo entre personajes nombrados.

Qué puedes construir

Cinco formas de larga duración.

Cada motor tiene su punto óptimo. Los audiolibros se apoyan en CosyVoice 3 para la fidelidad del narrador. Los podcasts multi-locutor se apoyan en VibeVoice por su contexto a nivel de episodio. Para streaming en tiempo real se usa el VibeVoice Realtime más pequeño.

Capítulos de audiolibro

Pasadas de capítulo completo con una voz de narrador consistente. Segmentación automática a nivel de frase, sin cosido manual.

Podcasts multi-locutor

Las etiquetas inline de hablante guían el cambio de turnos. Dos a cuatro voces para un episodio guionizado.

Podcast en vivo / streaming

Genera mientras el oyente escucha. VibeVoice Realtime mantiene la latencia lo bastante baja para conversaciones en vivo.

TTS de artículos

Artículos de newsletter, posts de blog, docs internos — renderizados como narración natural sin el ritmo de un lector de pantalla.

Narración accesible

Acceso a contenido largo para usuarios con discapacidad visual o de impresión, totalmente offline.

Lectura adicional

Guías de componentes.