FlashSR

यह Soniqo पेज स्थानीय speech-swift / speech-core implementation में FlashSR को दस्तावेज़ करता है। Hugging Face bundle links integration notes के बाद दिए गए हैं।

पहले आंतरिक पेज

Landing cards और docs menus पहले इसी पेज पर आते हैं; source model और bundle links यहीं उपलब्ध रहते हैं।

सारांश

मॉडलFlashSR
भूमिकाAudio super-resolution for low-bandwidth or lossy audio
BackendMLX int4 default; int8 available
Output48 kHz mono waveform, same length as input
भाषाएँAudio-content agnostic
लाइसेंसMIT
स्थितिReady through speech upsample and the FlashSR Swift product
SourceFlashSR / AudioSR distillation
Swift productFlashSR
CLI / runtimespeech upsample

उपयोग

नीचे का snippet मौजूदा speech-swift API या command से मेल खाता है।

# Upsample a low-bandwidth recording to 48 kHz mono.
.build/release/speech upsample noisy_lowres.wav \
  --variant int4 \
  -o clean_hr.wav

मॉडल लिंक

implementation notes