Benchmarks — Android

Ein RTF (Echtzeitfaktor) unter 1,0 bedeutet schneller als Echtzeit.

Android (ONNX Runtime)

Gemessen auf Android-Emulator (arm64-v8a, ohne NNAPI). Echte Hardware mit NNAPI ist deutlich schneller.

ModellAufgabeAudioInferenzRTF
Parakeet TDT v3STT (114 Sprachen)1,5 s175 ms0,12
Kokoro 82MTTS (7 Sprachen)1,9 s Ausgabe1.075 ms0,58
Silero VAD v5VAD32 ms Chunk<1 ms<0,01
DeepFilterNet3Rauschunterdrückung32 ms Chunk~5 ms~0,15
PlattformBeschleunigungChipsätze
AndroidNNAPISnapdragon 8 Gen 1+, Exynos 2200+, Google Tensor G2+
Eingebettetes LinuxQNN (Hexagon DSP)SA8295P, SA8255P
BeliebigCPU (XNNPACK)Alle arm64-v8a / x86_64
Hinweis

Die Android-Benchmarks stammen aus dem Emulator ohne Hardwarebeschleunigung. Auf echter Snapdragon-Hardware mit NNAPI-Delegation ist eine 2–3-fach schnellere Inferenz zu erwarten. Gesamte Modellgröße: ~1,2 GB (INT8-quantisiertes ONNX).