Silero VAD — Android

يعمل Silero VAD v5 على Android وLinux المضمّن عبر ONNX Runtime، ويوفّر كشفًا لنشاط الصوت بالبثّ بزمن انتقال دون المليّ ثانية. يعمل كمشغّل الكلام لخطّ الأنابيب — حيث لا يُشغَّل التعرّف على الكلام إلّا عند اكتشاف كلام، ممّا يوفّر الحوسبة.

النموذج

النموذجالمحرّكالحجمHuggingFace
Silero-VAD-v5ONNX Runtime~2 MBaufklarer/Silero-VAD-v5-ONNX

الأداء

المقياسالقيمة
حجم المقطع32 ms (512 عيّنة عند 16 kHz)
زمن الانتقالدون المليّ ثانية لكلّ مقطع
RTF< 0.01

الإعدادات

المعلَمةالقيمة الافتراضيةالوصف
min_silence_duration0.5sمدّة الصمت اللازمة لإنهاء مقطع كلام
min_speech_duration0.15sالحدّ الأدنى لمدّة الكلام لتفعيل الكشف
مهم

على Android، يُعدّ VAD جزءًا من SpeechPipeline ولا يُستخدَم بصورة مستقلّة. يتولّى خطّ الأنابيب تلقائيًّا تدفّق VAD → STT → TTS. راجع speech-android على GitHub لتفاصيل التكامل.

الشيفرة المصدريّة: github.com/soniqo/speech-android