Silero VAD — Android

Silero VAD v5, ONNX Runtime üzerinden Android ve gömülü Linux'ta çalışır ve milisaniye altı gecikmeyle akış ses etkinlik algılama sağlar. Pipeline'ın konuşma tetikleyicisi olarak görev yapar — STT yalnızca konuşma algılandığında çalışır, böylece işlem gücünden tasarruf edilir.

Model

ModelBackendBoyutHuggingFace
Silero-VAD-v5ONNX Runtime~2 MBaufklarer/Silero-VAD-v5-ONNX

Performans

MetrikDeğer
Parça boyutu32 ms (16 kHz'de 512 örnek)
GecikmeParça başına milisaniye altı
RTF< 0.01

Yapılandırma

ParametreVarsayılanAçıklama
min_silence_duration0.5sBir konuşma segmentini sonlandırmak için gereken sessizlik süresi
min_speech_duration0.15sAlgılamayı tetiklemek için minimum konuşma süresi
Önemli

Android'de VAD, SpeechPipeline'ın bir parçasıdır ve tek başına kullanılmaz. Pipeline, VAD → STT → TTS akışını otomatik olarak yönetir. Entegrasyon ayrıntıları için GitHub'da speech-android sayfasına bakın.

Kaynak kodu: github.com/soniqo/speech-android