यूज़-केस · कंटेंट क्रिएशन
कोई भी आवाज़।
कोई भी लंबाई।
स्पीच जनरेशन के तीन रूप — एक छोटी रेफ़रेंस क्लिप से सेकंडों में आवाज़ क्लोन कीजिए, रियल-टाइम से तेज़ रफ़्तार पर उच्च-गुणवत्ता का न्यूट्रल TTS रेंडर कीजिए, या घंटों लंबी ऑडियोबुक और मल्टी-स्पीकर पॉडकास्ट बनाइए। सब कुछ ऑन-डिवाइस।
तीन सब-यूज़-केस
सिंथेसिस के तीन स्वाद।
पर्सनलाइज़्ड आवाज़ों के लिए ज़ीरो-शॉट क्लोनिंग, ऐप UI के लिए तेज़ न्यूट्रल TTS, या नैरेशन और संवाद के लिए लॉन्ग-फ़ॉर्म। इंजन अलग, स्टैक एक ही — ऑन-डिवाइस।
वॉइस क्लोनिंग
5–30 सेकंड की रेफ़रेंस क्लिप से आवाज़ क्लोन। ज़ीरो-शॉट, फ़ाइन-ट्यूनिंग नहीं, नौ भाषाएँ।
स्टैंडर्ड TTS
उच्च-गुणवत्ता की न्यूट्रल स्पीच, रियल-टाइम से तेज़। ऐप UI, ऐक्सेसिबिलिटी और ऐप-इन नैरेशन के लिए छोटे बंडल।
लॉन्ग-फ़ॉर्म और मल्टी-स्पीकर
एक जैसे नैरेटर के साथ ऑडियोबुक चैप्टर, या इनलाइन स्पीकर टैग्स के साथ 90 मिनट तक के मल्टी-स्पीकर पॉडकास्ट।
और गहराई में पढ़ें
