Benchmarks — Android
Ein RTF (Echtzeitfaktor) unter 1,0 bedeutet schneller als Echtzeit.
Android (ONNX Runtime)
Gemessen auf Android-Emulator (arm64-v8a, ohne NNAPI). Echte Hardware mit NNAPI ist deutlich schneller.
| Modell | Aufgabe | Audio | Inferenz | RTF |
|---|---|---|---|---|
| Parakeet TDT v3 | STT (114 Sprachen) | 1,5 s | 175 ms | 0,12 |
| Kokoro 82M | TTS (7 Sprachen) | 1,9 s Ausgabe | 1.075 ms | 0,58 |
| Silero VAD v5 | VAD | 32 ms Chunk | <1 ms | <0,01 |
| DeepFilterNet3 | Rauschunterdrückung | 32 ms Chunk | ~5 ms | ~0,15 |
| Plattform | Beschleunigung | Chipsätze |
|---|---|---|
| Android | NNAPI | Snapdragon 8 Gen 1+, Exynos 2200+, Google Tensor G2+ |
| Eingebettetes Linux | QNN (Hexagon DSP) | SA8295P, SA8255P |
| Beliebig | CPU (XNNPACK) | Alle arm64-v8a / x86_64 |
Hinweis
Die Android-Benchmarks stammen aus dem Emulator ohne Hardwarebeschleunigung. Auf echter Snapdragon-Hardware mit NNAPI-Delegation ist eine 2–3-fach schnellere Inferenz zu erwarten. Gesamte Modellgröße: ~1,2 GB (INT8-quantisiertes ONNX).