N’importe quelle voix.
N’importe quelle durée.
Trois formes de génération vocale — clonez une voix en quelques secondes depuis un court clip de référence, rendez du TTS neutre de haute qualité plus vite que le temps réel, ou produisez des livres audio d’une heure et des podcasts multi-locuteurs. Tout sur l’appareil.
Trois saveurs de synthèse.
Clonage zéro-shot pour des voix personnalisées, TTS neutre rapide pour l’UI d’app, ou longue durée pour narration et dialogue. Moteurs différents, même stack embarquée.
Clonez une voix depuis un clip de 5–30 s. Zéro-shot, sans fine-tuning, en neuf langues.
Voix neutre de haute qualité, plus rapide que le temps réel. Bundles compacts pour UI d’app, accessibilité et narration in-app.
Chapitres de livre audio avec un narrateur cohérent, ou podcasts multi-locuteurs jusqu’à 90 min avec balises inline de locuteur.
