Chatterbox Multilingual

توثق هذه الصفحة من Soniqo نموذج Chatterbox Multilingual كما هو منفذ في speech-swift / speech-core. روابط Hugging Face موجودة أدناه بعد ملاحظات الدمج.

الصفحة الداخلية أولا

بطاقات الصفحة الرئيسية وقوائم الوثائق تشير إلى هذه الصفحة أولا؛ وتبقى روابط النموذج والحزم داخلها.

لمحة سريعة

النموذج	Chatterbox Multilingual
الدور	Multilingual zero-shot voice-cloning TTS
Backend	MLX fp16 on Apple; LiteRT default-voice runtime in Speech Core
الإخراج	24 kHz mono waveform
اللغات	23 languages
الرخصة	MIT
الحالة	MLX cloning runtime; LiteRT greedy/default-voice runtime for edge deployments
المصدر	Resemble AI Chatterbox
منتج Swift	`ChatterboxTTS`
CLI / runtime	Programmatic speech-swift runtime; LiteRT example CLI in speech-core/examples/litert

الاستخدام

المقتطف أدناه يطابق API أو الأمر الحالي في speech-swift.

import ChatterboxTTS

let model = try await ChatterboxTTSModel.fromPretrained()
let pcm = try model.clone(
    referenceSamples: reference,
    sampleRate: 24_000,
    text: "The cloned voice now speaks a new sentence.",
    languageId: "en"
)

روابط النموذج

ملاحظات التنفيذ

Download is split between the main Chatterbox bundle and the separate S3 tokenizer repository.
Pipeline is T3 text-to-speech tokens, S3Gen flow mel decoder, then HiFi-GAN / HiFTGenerator vocoder.
Reference clips are resampled to 24 kHz for S3Gen and 16 kHz for speaker/token conditioning.
speech-core's LiteRT path ships a default voice; fp16 T3 is recommended for Arabic quality.