Silero VAD — Android
يعمل Silero VAD v5 على Android وLinux المضمّن عبر ONNX Runtime، ويوفّر كشفًا لنشاط الصوت بالبثّ بزمن انتقال دون المليّ ثانية. يعمل كمشغّل الكلام لخطّ الأنابيب — حيث لا يُشغَّل التعرّف على الكلام إلّا عند اكتشاف كلام، ممّا يوفّر الحوسبة.
النموذج
| النموذج | المحرّك | الحجم | HuggingFace |
|---|---|---|---|
| Silero-VAD-v5 | ONNX Runtime | ~2 MB | aufklarer/Silero-VAD-v5-ONNX |
الأداء
| المقياس | القيمة |
|---|---|
| حجم المقطع | 32 ms (512 عيّنة عند 16 kHz) |
| زمن الانتقال | دون المليّ ثانية لكلّ مقطع |
| RTF | < 0.01 |
الإعدادات
| المعلَمة | القيمة الافتراضية | الوصف |
|---|---|---|
min_silence_duration | 0.5s | مدّة الصمت اللازمة لإنهاء مقطع كلام |
min_speech_duration | 0.15s | الحدّ الأدنى لمدّة الكلام لتفعيل الكشف |
مهم
على Android، يُعدّ VAD جزءًا من SpeechPipeline ولا يُستخدَم بصورة مستقلّة. يتولّى خطّ الأنابيب تلقائيًّا تدفّق VAD → STT → TTS. راجع speech-android على GitHub لتفاصيل التكامل.
الشيفرة المصدريّة: github.com/soniqo/speech-android