Des heures d’audio.
Une voix cohérente.
Chapitres de livres audio, épisodes de podcast, narration de formation — rendus sur l’appareil, sur Apple Silicon, Android ou Linux embarqué. La segmentation automatique maintient la voix stable sur des heures ; le mode multi-locuteurs gère le dialogue entre personnages nommés.
Cinq formes longues.
Chaque moteur a son point fort. Les livres audio s’appuient sur CosyVoice 3 pour la fidélité du narrateur. Les podcasts multi-locuteurs s’appuient sur VibeVoice pour son contexte à l’échelle de l’épisode. Le streaming temps réel utilise le plus petit VibeVoice Realtime.
Passes de chapitre entier avec une voix de narrateur cohérente. Segmentation automatique par phrase, sans recollage manuel.
Les balises inline de locuteur pilotent les tours de parole. Distribuez deux à quatre voix sur un épisode entier.
Générez pendant que l’auditeur écoute. VibeVoice Realtime maintient la latence assez basse pour les conversations en direct.
Articles de newsletter, billets de blog, docs internes — rendus en narration naturelle, sans le rythme d’un lecteur d’écran.
Accès aux contenus longs pour les personnes ayant des troubles visuels ou de lecture, entièrement hors-ligne.
