Бенчмарки — Android
RTF (real-time factor) ниже 1.0 означает быстрее реального времени.
Android (ONNX Runtime)
Измерено на эмуляторе Android (arm64-v8a, без NNAPI). Реальное оборудование с NNAPI значительно быстрее.
| Модель | Задача | Аудио | Инференс | RTF |
|---|---|---|---|---|
| Parakeet TDT v3 | STT (114 языков) | 1.5 с | 175 мс | 0.12 |
| Kokoro 82M | TTS (7 языков) | 1.9 с на выходе | 1 075 мс | 0.58 |
| Silero VAD v5 | VAD | чанк 32 мс | <1 мс | <0.01 |
| DeepFilterNet3 | Подавление шума | чанк 32 мс | ~5 мс | ~0.15 |
| Платформа | Ускорение | Чипсеты |
|---|---|---|
| Android | NNAPI | Snapdragon 8 Gen 1+, Exynos 2200+, Google Tensor G2+ |
| Embedded Linux | QNN (Hexagon DSP) | SA8295P, SA8255P |
| Любая | CPU (XNNPACK) | Все arm64-v8a / x86_64 |
Примечание
Android-бенчмарки сделаны на эмуляторе без аппаратного ускорения. На реальном оборудовании Snapdragon с делегированием NNAPI ожидайте инференс в 2–3 раза быстрее. Общий размер моделей: ~1.2 ГБ (INT8-квантизированный ONNX).