벤치마크 — Android

RTF (실시간 계수)가 1.0보다 작으면 실시간보다 빠르다는 의미입니다.

Android (ONNX Runtime)

Android 에뮬레이터 (arm64-v8a, NNAPI 미사용)에서 측정되었습니다. NNAPI가 있는 실제 하드웨어에서는 훨씬 빠릅니다.

모델작업오디오추론RTF
Parakeet TDT v3STT (114개 언어)1.5초175ms0.12
Kokoro 82MTTS (7개 언어)1.9초 출력1,075ms0.58
Silero VAD v5VAD32ms 청크<1ms<0.01
DeepFilterNet3노이즈 제거32ms 청크약 5ms약 0.15
플랫폼가속칩셋
AndroidNNAPISnapdragon 8 Gen 1+, Exynos 2200+, Google Tensor G2+
임베디드 LinuxQNN (Hexagon DSP)SA8295P, SA8255P
모두CPU (XNNPACK)모든 arm64-v8a / x86_64
참고

Android 벤치마크는 하드웨어 가속 없는 에뮬레이터에서 얻은 것입니다. NNAPI 위임이 적용된 실제 Snapdragon 하드웨어에서는 2–3배 더 빠른 추론을 기대할 수 있습니다. 총 모델 크기: 약 1.2 GB (INT8 양자화 ONNX).