यूज़-केस · कंटेंट क्रिएशन

कोई भी आवाज़।
कोई भी लंबाई।

स्पीच जनरेशन के तीन रूप — एक छोटी रेफ़रेंस क्लिप से सेकंडों में आवाज़ क्लोन कीजिए, रियल-टाइम से तेज़ रफ़्तार पर उच्च-गुणवत्ता का न्यूट्रल TTS रेंडर कीजिए, या घंटों लंबी ऑडियोबुक और मल्टी-स्पीकर पॉडकास्ट बनाइए। सब कुछ ऑन-डिवाइस।

शुरू करें वॉइस क्लोनिंग गाइड

तीन सब-यूज़-केस

सिंथेसिस के तीन स्वाद।

पर्सनलाइज़्ड आवाज़ों के लिए ज़ीरो-शॉट क्लोनिंग, ऐप UI के लिए तेज़ न्यूट्रल TTS, या नैरेशन और संवाद के लिए लॉन्ग-फ़ॉर्म। इंजन अलग, स्टैक एक ही — ऑन-डिवाइस।

वॉइस क्लोनिंग

5–30 सेकंड की रेफ़रेंस क्लिप से आवाज़ क्लोन। ज़ीरो-शॉट, फ़ाइन-ट्यूनिंग नहीं, नौ भाषाएँ।

स्टैंडर्ड TTS

उच्च-गुणवत्ता की न्यूट्रल स्पीच, रियल-टाइम से तेज़। ऐप UI, ऐक्सेसिबिलिटी और ऐप-इन नैरेशन के लिए छोटे बंडल।

लॉन्ग-फ़ॉर्म और मल्टी-स्पीकर

एक जैसे नैरेटर के साथ ऑडियोबुक चैप्टर, या इनलाइन स्पीकर टैग्स के साथ 90 मिनट तक के मल्टी-स्पीकर पॉडकास्ट।

और गहराई में पढ़ें