Benchmarks — Android

Un RTF (factor de tiempo real) por debajo de 1.0 significa más rápido que tiempo real.

Android (ONNX Runtime)

Medido en emulador de Android (arm64-v8a, sin NNAPI). El hardware real con NNAPI es significativamente más rápido.

ModeloTareaAudioInferenciaRTF
Parakeet TDT v3STT (114 idiomas)1.5s175ms0.12
Kokoro 82MTTS (7 idiomas)1.9s de salida1,075ms0.58
Silero VAD v5VADchunk de 32ms<1ms<0.01
DeepFilterNet3Cancelación de ruidochunk de 32ms~5ms~0.15
PlataformaAceleraciónChipsets
AndroidNNAPISnapdragon 8 Gen 1+, Exynos 2200+, Google Tensor G2+
Linux embebidoQNN (Hexagon DSP)SA8295P, SA8255P
CualquieraCPU (XNNPACK)Todos arm64-v8a / x86_64
Nota

Los benchmarks de Android provienen del emulador sin aceleración por hardware. En hardware Snapdragon real con delegación NNAPI, espera una inferencia 2–3 veces más rápida. Tamaño total del modelo: ~1.2 GB (ONNX cuantizado en INT8).