Stable Audio 3

توثق هذه الصفحة من Soniqo نموذج Stable Audio 3 كما هو منفذ في speech-swift / speech-core. روابط Hugging Face موجودة أدناه بعد ملاحظات الدمج.

الصفحة الداخلية أولا

بطاقات الصفحة الرئيسية وقوائم الوثائق تشير إلى هذه الصفحة أولا؛ وتبقى روابط النموذج والحزم داخلها.

لمحة سريعة

النموذجStable Audio 3
الدورText-to-music generation
BackendMLX, Medium DiT int8 default with int4 variant available
الإخراج44.1 kHz stereo Float PCM
اللغاتPrompt language depends on the T5Gemma text encoder
الرخصةStable Audio model terms apply
الحالةDefault speech compose engine for Stable Audio 3 Medium
المصدرStability AI Stable Audio 3
منتج SwiftStableAudio3MusicGen
CLI / runtimespeech compose --engine sa3

الاستخدام

المقتطف أدناه يطابق API أو الأمر الحالي في speech-swift.

# Generate 30 seconds of 44.1 kHz stereo audio.
.build/release/speech compose "lofi house loop" \
  --engine sa3 \
  --sa3-variant medium-int8 \
  --seconds 30 \
  -o music.wav

روابط النموذج

ملاحظات التنفيذ