Benchmarks — Android
RTF(实时因子)小于 1.0 表示快于实时。
Android (ONNX Runtime)
在 Android 模拟器(arm64-v8a,无 NNAPI)上测量。带 NNAPI 的真机明显更快。
| 模型 | 任务 | 音频 | 推理时间 | RTF |
|---|---|---|---|---|
| Parakeet TDT v3 | STT(114 种语言) | 1.5s | 175ms | 0.12 |
| Kokoro 82M | TTS(7 种语言) | 1.9s 输出 | 1,075ms | 0.58 |
| Silero VAD v5 | VAD | 32ms chunk | <1ms | <0.01 |
| DeepFilterNet3 | 降噪 | 32ms chunk | ~5ms | ~0.15 |
| 平台 | 加速 | 芯片组 |
|---|---|---|
| Android | NNAPI | Snapdragon 8 Gen 1+、Exynos 2200+、Google Tensor G2+ |
| 嵌入式 Linux | QNN (Hexagon DSP) | SA8295P、SA8255P |
| 任意 | CPU (XNNPACK) | 所有 arm64-v8a / x86_64 |
注意
Android 的基准来自不带硬件加速的模拟器。在带 NNAPI 代理的真实 Snapdragon 硬件上,可预期获得 2–3 倍的推理提速。模型总大小:约 1.2 GB(INT8 量化 ONNX)。