Benchmarks — Android
Un RTF (facteur temps réel) inférieur à 1,0 signifie plus rapide que le temps réel.
Android (ONNX Runtime)
Mesuré sur l'émulateur Android (arm64-v8a, sans NNAPI). Le matériel réel avec NNAPI est nettement plus rapide.
| Modèle | Tâche | Audio | Inférence | RTF |
|---|---|---|---|---|
| Parakeet TDT v3 | STT (114 langues) | 1,5 s | 175 ms | 0,12 |
| Kokoro 82M | TTS (7 langues) | 1,9 s en sortie | 1 075 ms | 0,58 |
| Silero VAD v5 | VAD | chunk de 32 ms | <1 ms | <0,01 |
| DeepFilterNet3 | Suppression de bruit | chunk de 32 ms | ~5 ms | ~0,15 |
| Plateforme | Accélération | Chipsets |
|---|---|---|
| Android | NNAPI | Snapdragon 8 Gen 1+, Exynos 2200+, Google Tensor G2+ |
| Linux embarqué | QNN (DSP Hexagon) | SA8295P, SA8255P |
| Toutes | CPU (XNNPACK) | Tous arm64-v8a / x86_64 |
Note
Les benchmarks Android proviennent d'un émulateur sans accélération matérielle. Sur du matériel Snapdragon réel avec délégation NNAPI, attendez-vous à une inférence 2–3× plus rapide. Taille totale des modèles : ~1,2 Go (ONNX quantifié INT8).