Бенчмарки — Android

RTF (real-time factor) ниже 1.0 означает быстрее реального времени.

Android (ONNX Runtime)

Измерено на эмуляторе Android (arm64-v8a, без NNAPI). Реальное оборудование с NNAPI значительно быстрее.

МодельЗадачаАудиоИнференсRTF
Parakeet TDT v3STT (114 языков)1.5 с175 мс0.12
Kokoro 82MTTS (7 языков)1.9 с на выходе1 075 мс0.58
Silero VAD v5VADчанк 32 мс<1 мс<0.01
DeepFilterNet3Подавление шумачанк 32 мс~5 мс~0.15
ПлатформаУскорениеЧипсеты
AndroidNNAPISnapdragon 8 Gen 1+, Exynos 2200+, Google Tensor G2+
Embedded LinuxQNN (Hexagon DSP)SA8295P, SA8255P
ЛюбаяCPU (XNNPACK)Все arm64-v8a / x86_64
Примечание

Android-бенчмарки сделаны на эмуляторе без аппаратного ускорения. На реальном оборудовании Snapdragon с делегированием NNAPI ожидайте инференс в 2–3 раза быстрее. Общий размер моделей: ~1.2 ГБ (INT8-квантизированный ONNX).