OmniVoice

توثق هذه الصفحة من Soniqo نموذج OmniVoice كما هو منفذ في speech-swift / speech-core. روابط Hugging Face موجودة أدناه بعد ملاحظات الدمج.

الصفحة الداخلية أولا

بطاقات الصفحة الرئيسية وقوائم الوثائق تشير إلى هذه الصفحة أولا؛ وتبقى روابط النموذج والحزم داخلها.

لمحة سريعة

النموذجOmniVoice
الدورMassively multilingual zero-shot voice-cloning TTS
BackendMLX int8 default bundle; fp16 bundle available
الإخراج24 kHz mono waveform
اللغات600+ languages
الرخصةApache-2.0 upstream family
الحالةProgrammatic speech-swift runtime used by Studio sidecar
المصدرk2-fsa OmniVoice
منتج SwiftOmniVoiceTTS
CLI / runtimeProgrammatic runtime; not a primary speech speak engine yet

الاستخدام

المقتطف أدناه يطابق API أو الأمر الحالي في speech-swift.

import OmniVoiceTTS

let model = try await OmniVoiceTTSModel.fromPretrained()
let pcm = try model.generate(
    text: "A new sentence in the reference speaker's voice.",
    referenceAudio: URL(fileURLWithPath: "reference.wav"),
    referenceText: "This is the reference voice.",
    language: "en"
)

روابط النموذج

ملاحظات التنفيذ