Silero VAD — Android

Silero VAD v5 roda em Android e Linux embarcado via ONNX Runtime, fornecendo deteccao de atividade de voz em streaming com latencia sub-milissegundo. Serve como o gatilho de fala do pipeline — o STT so roda quando fala e detectada, economizando computacao.

Modelo

ModeloBackendTamanhoHuggingFace
Silero-VAD-v5ONNX Runtime~2 MBaufklarer/Silero-VAD-v5-ONNX

Desempenho

MetricaValor
Tamanho do chunk32 ms (512 amostras a 16 kHz)
LatenciaSub-milissegundo por chunk
RTF< 0.01

Configuracao

ParametroPadraoDescricao
min_silence_duration0.5sDuracao de silencio necessaria para encerrar um segmento de fala
min_speech_duration0.15sDuracao minima de fala para disparar a deteccao
Importante

No Android, o VAD e parte do SpeechPipeline e nao e usado isoladamente. O pipeline gerencia automaticamente o fluxo VAD → STT → TTS. Veja speech-android no GitHub para detalhes de integracao.

Codigo-fonte: github.com/soniqo/speech-android