حالة استخدام · إنشاء المحتوى
استنسخ صوتاً في 30 ثانية.
ركِّب لساعات.
استنساخ صوت بصفر-إطلاق على Apple Silicon. قدِّم مقطعاً مرجعياً مدّته 5–30 ثانية مع نصه؛ يولّد CosyVoice 3 كلاماً بهذا الجرس في تسع لغات، دون اتصال بالإنترنت. بدون ضبط دقيق، بدون تسعير بالحرف، وبدون خروج صوت من الجهاز.
ما يمكنك بناؤه
خمس وصفات لاستنساخ الصوت.
كل وصفة تدور حول CosyVoice 3 للتركيب لكنها تمزج بين مكوّنات قبلية/بعدية مختلفة — embeddings للمطابقة، إزالة ضوضاء لمرجع نظيف، Qwen3-TTS ICL عندما لا تملك إلا صوتاً.
سرد الكتب الصوتية
استنسخ المؤلف أو صوتاً مختاراً مرّة واحدة وأنتج ساعات من السرد المتّسق.
الدبلجة والترجمة المحلية
حافظ على صوت المُقدِّم على المسارات المترجمة، في تسع لغات.
أصوات شخصيات
اثنان إلى أربعة أصوات مخصّصة لكل مشهد عبر علامات متحدّثين سطرية.
TTS بصوت شخصي
استرجِع صوتاً مألوفاً للمستخدمين الذين لم يعد بإمكانهم التحدّث بصورة طبيعية.
صوت العلامة التجارية
راوٍ واحد متّسق عبر خط منتجات كامل.
قراءة معمّقة
