FlashSR

Esta página da Soniqo documenta FlashSR conforme a implementação local em speech-swift / speech-core. Os links do Hugging Face ficam abaixo das notas de integração.

Página interna primeiro

Cards e menus apontam primeiro para cá; os links do modelo fonte e dos bundles continuam disponíveis nesta página.

Visão geral

ModeloFlashSR
PapelAudio super-resolution for low-bandwidth or lossy audio
BackendMLX int4 default; int8 available
Saída48 kHz mono waveform, same length as input
IdiomasAudio-content agnostic
LicençaMIT
StatusReady through speech upsample and the FlashSR Swift product
FonteFlashSR / AudioSR distillation
Produto SwiftFlashSR
CLI / runtimespeech upsample

Uso

O trecho abaixo reflete a API ou comando atual exposto por speech-swift.

# Upsample a low-bandwidth recording to 48 kHz mono.
.build/release/speech upsample noisy_lowres.wav \
  --variant int4 \
  -o clean_hr.wav

Links do modelo

Notas de implementação