Stable Audio 3

Bu Soniqo sayfası, yerel speech-swift / speech-core uygulamasındaki Stable Audio 3 modelini belgeler. Hugging Face bundle bağlantıları entegrasyon notlarından sonra yer alır.

Önce dahili sayfa

Açılış kartları ve belge menüleri önce buraya yönlenir; kaynak model ve bundle bağlantıları bu sayfada kalır.

Özet

ModelStable Audio 3
RolText-to-music generation
BackendMLX, Medium DiT int8 default with int4 variant available
Çıktı44.1 kHz stereo Float PCM
DillerPrompt language depends on the T5Gemma text encoder
LisansStable Audio model terms apply
DurumDefault speech compose engine for Stable Audio 3 Medium
KaynakStability AI Stable Audio 3
Swift ürünüStableAudio3MusicGen
CLI / runtimespeech compose --engine sa3

Kullanım

Aşağıdaki parça, speech-swift deposundaki güncel API veya komutla eşleşir.

# Generate 30 seconds of 44.1 kHz stereo audio.
.build/release/speech compose "lofi house loop" \
  --engine sa3 \
  --sa3-variant medium-int8 \
  --seconds 30 \
  -o music.wav

Model bağlantıları

Uygulama notları