Stable Audio 3

Esta página da Soniqo documenta Stable Audio 3 conforme a implementação local em speech-swift / speech-core. Os links do Hugging Face ficam abaixo das notas de integração.

Página interna primeiro

Cards e menus apontam primeiro para cá; os links do modelo fonte e dos bundles continuam disponíveis nesta página.

Visão geral

ModeloStable Audio 3
PapelText-to-music generation
BackendMLX, Medium DiT int8 default with int4 variant available
Saída44.1 kHz stereo Float PCM
IdiomasPrompt language depends on the T5Gemma text encoder
LicençaStable Audio model terms apply
StatusDefault speech compose engine for Stable Audio 3 Medium
FonteStability AI Stable Audio 3
Produto SwiftStableAudio3MusicGen
CLI / runtimespeech compose --engine sa3

Uso

O trecho abaixo reflete a API ou comando atual exposto por speech-swift.

# Generate 30 seconds of 44.1 kHz stereo audio.
.build/release/speech compose "lofi house loop" \
  --engine sa3 \
  --sa3-variant medium-int8 \
  --seconds 30 \
  -o music.wav

Links do modelo

Notas de implementação