Benchmark — Android
RTF (ค่าตัวประกอบเรียลไทม์) ต่ำกว่า 1.0 หมายถึงเร็วกว่าเรียลไทม์
Android (ONNX Runtime)
วัดบน โปรแกรมจำลอง Android (arm64-v8a, ไม่มี NNAPI) ฮาร์ดแวร์จริงที่มี NNAPI จะเร็วกว่าอย่างมีนัยสำคัญ
| โมเดล | งาน | เสียง | อินเฟอเรนซ์ | RTF |
|---|---|---|---|---|
| Parakeet TDT v3 | STT (114 ภาษา) | 1.5s | 175ms | 0.12 |
| Kokoro 82M | TTS (7 ภาษา) | เอาต์พุต 1.9s | 1,075ms | 0.58 |
| Silero VAD v5 | VAD | chunk 32ms | <1ms | <0.01 |
| DeepFilterNet3 | การลดสัญญาณรบกวน | chunk 32ms | ~5ms | ~0.15 |
| แพลตฟอร์ม | การเร่งความเร็ว | ชิปเซ็ต |
|---|---|---|
| Android | NNAPI | Snapdragon 8 Gen 1+, Exynos 2200+, Google Tensor G2+ |
| Linux แบบฝังตัว | QNN (Hexagon DSP) | SA8295P, SA8255P |
| ใด ๆ | CPU (XNNPACK) | arm64-v8a / x86_64 ทั้งหมด |
หมายเหตุ
Benchmark Android มาจากโปรแกรมจำลองที่ไม่มีการเร่งความเร็วด้วยฮาร์ดแวร์ บนฮาร์ดแวร์ Snapdragon จริงพร้อม delegation NNAPI คาดว่าอินเฟอเรนซ์จะเร็วขึ้น 2–3 เท่า ขนาดโมเดลทั้งหมด: ~1.2 GB (ONNX ที่ควอนไทซ์ INT8)