Benchmarks — Android
Un RTF (factor de tiempo real) por debajo de 1.0 significa más rápido que tiempo real.
Android (ONNX Runtime)
Medido en emulador de Android (arm64-v8a, sin NNAPI). El hardware real con NNAPI es significativamente más rápido.
| Modelo | Tarea | Audio | Inferencia | RTF |
|---|---|---|---|---|
| Parakeet TDT v3 | STT (114 idiomas) | 1.5s | 175ms | 0.12 |
| Kokoro 82M | TTS (7 idiomas) | 1.9s de salida | 1,075ms | 0.58 |
| Silero VAD v5 | VAD | chunk de 32ms | <1ms | <0.01 |
| DeepFilterNet3 | Cancelación de ruido | chunk de 32ms | ~5ms | ~0.15 |
| Plataforma | Aceleración | Chipsets |
|---|---|---|
| Android | NNAPI | Snapdragon 8 Gen 1+, Exynos 2200+, Google Tensor G2+ |
| Linux embebido | QNN (Hexagon DSP) | SA8295P, SA8255P |
| Cualquiera | CPU (XNNPACK) | Todos arm64-v8a / x86_64 |
Nota
Los benchmarks de Android provienen del emulador sin aceleración por hardware. En hardware Snapdragon real con delegación NNAPI, espera una inferencia 2–3 veces más rápida. Tamaño total del modelo: ~1.2 GB (ONNX cuantizado en INT8).