حالة استخدام · إنشاء المحتوى
أيُّ صوت.
أيُّ مدّة.
ثلاث صور لتوليد الكلام — استنسخ صوتاً في ثوانٍ من مقطع قصير، أو أنتج TTS محايداً عالي الجودة أسرع من الزمن الحقيقي، أو أنتج كتباً صوتية بطول ساعة وبودكاست متعدّد المتحدّثين. كل ذلك على الجهاز.
ثلاث حالات استخدام فرعية
ثلاث نكهات من التركيب.
استنساخ صفر-إطلاق للأصوات المخصّصة، أو TTS محايد سريع لواجهة التطبيق، أو طويل المدى للسرد والحوار. محرّكات مختلفة، نفس الحزمة على الجهاز.
استنساخ الصوت
استنسخ صوتاً من مقطع مرجعي مدّته 5–30 ثانية. صفر-إطلاق، بدون ضبط دقيق، في تسع لغات.
TTS قياسي
صوت محايد عالي الجودة، أسرع من الزمن الحقيقي. حزم مدمجة لواجهة التطبيق، وسهولة الوصول، والسرد داخل التطبيق.
طويل المدى ومتعدّد المتحدّثين
فصول كتب صوتية بصوت راوٍ متّسق، أو بودكاست متعدّد المتحدّثين حتى 90 دقيقة بعلامات سطرية.
قراءة معمّقة
