Benchmarks — Android
1.0 से नीचे RTF (real-time factor) का अर्थ है रियल-टाइम से तेज़।
Android (ONNX Runtime)
Android एमुलेटर (arm64-v8a, कोई NNAPI नहीं) पर मापा गया। NNAPI के साथ वास्तविक हार्डवेयर काफी तेज़ है।
| मॉडल | कार्य | ऑडियो | इन्फ़रेंस | RTF |
|---|---|---|---|---|
| Parakeet TDT v3 | STT (114 भाषाएँ) | 1.5s | 175ms | 0.12 |
| Kokoro 82M | TTS (7 भाषाएँ) | 1.9s आउटपुट | 1,075ms | 0.58 |
| Silero VAD v5 | VAD | 32ms chunk | <1ms | <0.01 |
| DeepFilterNet3 | नॉइज़ कैंसलेशन | 32ms chunk | ~5ms | ~0.15 |
| प्लेटफ़ॉर्म | एक्सेलेरेशन | चिपसेट |
|---|---|---|
| Android | NNAPI | Snapdragon 8 Gen 1+, Exynos 2200+, Google Tensor G2+ |
| एम्बेडेड Linux | QNN (Hexagon DSP) | SA8295P, SA8255P |
| कोई भी | CPU (XNNPACK) | सभी arm64-v8a / x86_64 |
नोट
Android benchmarks हार्डवेयर एक्सेलेरेशन के बिना एमुलेटर से हैं। NNAPI delegation के साथ वास्तविक Snapdragon हार्डवेयर पर, 2–3x तेज़ इन्फ़रेंस की अपेक्षा करें। कुल मॉडल आकार: ~1.2 GB (INT8 क्वांटाइज़्ड ONNX)।