벤치마크 — Android
RTF (실시간 계수)가 1.0보다 작으면 실시간보다 빠르다는 의미입니다.
Android (ONNX Runtime)
Android 에뮬레이터 (arm64-v8a, NNAPI 미사용)에서 측정되었습니다. NNAPI가 있는 실제 하드웨어에서는 훨씬 빠릅니다.
| 모델 | 작업 | 오디오 | 추론 | RTF |
|---|---|---|---|---|
| Parakeet TDT v3 | STT (114개 언어) | 1.5초 | 175ms | 0.12 |
| Kokoro 82M | TTS (7개 언어) | 1.9초 출력 | 1,075ms | 0.58 |
| Silero VAD v5 | VAD | 32ms 청크 | <1ms | <0.01 |
| DeepFilterNet3 | 노이즈 제거 | 32ms 청크 | 약 5ms | 약 0.15 |
| 플랫폼 | 가속 | 칩셋 |
|---|---|---|
| Android | NNAPI | Snapdragon 8 Gen 1+, Exynos 2200+, Google Tensor G2+ |
| 임베디드 Linux | QNN (Hexagon DSP) | SA8295P, SA8255P |
| 모두 | CPU (XNNPACK) | 모든 arm64-v8a / x86_64 |
참고
Android 벤치마크는 하드웨어 가속 없는 에뮬레이터에서 얻은 것입니다. NNAPI 위임이 적용된 실제 Snapdragon 하드웨어에서는 2–3배 더 빠른 추론을 기대할 수 있습니다. 총 모델 크기: 약 1.2 GB (INT8 양자화 ONNX).