Silero VAD — Android
Silero VAD v5, ONNX Runtime üzerinden Android ve gömülü Linux'ta çalışır ve milisaniye altı gecikmeyle akış ses etkinlik algılama sağlar. Pipeline'ın konuşma tetikleyicisi olarak görev yapar — STT yalnızca konuşma algılandığında çalışır, böylece işlem gücünden tasarruf edilir.
Model
| Model | Backend | Boyut | HuggingFace |
|---|---|---|---|
| Silero-VAD-v5 | ONNX Runtime | ~2 MB | aufklarer/Silero-VAD-v5-ONNX |
Performans
| Metrik | Değer |
|---|---|
| Parça boyutu | 32 ms (16 kHz'de 512 örnek) |
| Gecikme | Parça başına milisaniye altı |
| RTF | < 0.01 |
Yapılandırma
| Parametre | Varsayılan | Açıklama |
|---|---|---|
min_silence_duration | 0.5s | Bir konuşma segmentini sonlandırmak için gereken sessizlik süresi |
min_speech_duration | 0.15s | Algılamayı tetiklemek için minimum konuşma süresi |
Önemli
Android'de VAD, SpeechPipeline'ın bir parçasıdır ve tek başına kullanılmaz. Pipeline, VAD → STT → TTS akışını otomatik olarak yönetir. Entegrasyon ayrıntıları için GitHub'da speech-android sayfasına bakın.
Kaynak kodu: github.com/soniqo/speech-android