Benchmarks — Android

RTF(实时因子)小于 1.0 表示快于实时。

Android (ONNX Runtime)

Android 模拟器(arm64-v8a,无 NNAPI)上测量。带 NNAPI 的真机明显更快。

模型任务音频推理时间RTF
Parakeet TDT v3STT(114 种语言)1.5s175ms0.12
Kokoro 82MTTS(7 种语言)1.9s 输出1,075ms0.58
Silero VAD v5VAD32ms chunk<1ms<0.01
DeepFilterNet3降噪32ms chunk~5ms~0.15
平台加速芯片组
AndroidNNAPISnapdragon 8 Gen 1+、Exynos 2200+、Google Tensor G2+
嵌入式 LinuxQNN (Hexagon DSP)SA8295P、SA8255P
任意CPU (XNNPACK)所有 arm64-v8a / x86_64
注意

Android 的基准来自不带硬件加速的模拟器。在带 NNAPI 代理的真实 Snapdragon 硬件上,可预期获得 2–3 倍的推理提速。模型总大小:约 1.2 GB(INT8 量化 ONNX)。