Stunden Audio.
Eine konsistente Stimme.
Hörbuchkapitel, Podcast-Episoden, Schulungs-Narration — gerendert auf dem Gerät, auf Apple Silicon, Android oder Embedded Linux. Automatische Segmentierung hält die Stimme stundenlang stabil; der Multi-Sprecher-Modus übernimmt Dialoge zwischen benannten Figuren.
Fünf Langform-Formate.
Jede Engine hat ihren Sweet Spot. Hörbücher setzen auf CosyVoice 3 für die Erzähler-Treue. Multi-Sprecher-Podcasts setzen auf VibeVoice wegen Episoden-Kontext. Echtzeit / Streaming nutzt das kleinere VibeVoice Realtime.
Komplette Kapitel-Durchgänge mit konsistenter Erzählerstimme. Automatische Satz-Segmentierung, kein manuelles Zusammenfügen.
Inline-Sprecher-Tags steuern den Wechsel. Cast zwei bis vier Stimmen für eine episodenlange skriptete Show.
Erzeuge, während der Hörer zuhört. VibeVoice Realtime hält die Latenz niedrig genug für Live-Gespräche.
Newsletter-Artikel, Blog-Posts, interne Docs — als natürliche Narration ohne Screen-Reader-Tempo.
Langform-Inhalte für Menschen mit Druck- oder Seh-Einschränkungen, vollständig offline.
