Stable Audio 3

Trang Soniqo này ghi lại Stable Audio 3 theo triển khai hiện có trong speech-swift / speech-core. Liên kết Hugging Face nằm bên dưới phần ghi chú tích hợp.

Ưu tiên trang nội bộ

Thẻ trên trang chính và menu tài liệu trỏ vào đây trước; liên kết model nguồn và bundle vẫn có trong trang này.

Tổng quan

ModelStable Audio 3
Vai tròText-to-music generation
BackendMLX, Medium DiT int8 default with int4 variant available
Đầu ra44.1 kHz stereo Float PCM
Ngôn ngữPrompt language depends on the T5Gemma text encoder
Giấy phépStable Audio model terms apply
Trạng tháiDefault speech compose engine for Stable Audio 3 Medium
NguồnStability AI Stable Audio 3
Sản phẩm SwiftStableAudio3MusicGen
CLI / runtimespeech compose --engine sa3

Cách dùng

Đoạn dưới đây khớp với API hoặc lệnh hiện tại do speech-swift cung cấp.

# Generate 30 seconds of 44.1 kHz stereo audio.
.build/release/speech compose "lofi house loop" \
  --engine sa3 \
  --sa3-variant medium-int8 \
  --seconds 30 \
  -o music.wav

Liên kết model

Ghi chú triển khai