Benchmark — Android

RTF (ค่าตัวประกอบเรียลไทม์) ต่ำกว่า 1.0 หมายถึงเร็วกว่าเรียลไทม์

Android (ONNX Runtime)

วัดบน โปรแกรมจำลอง Android (arm64-v8a, ไม่มี NNAPI) ฮาร์ดแวร์จริงที่มี NNAPI จะเร็วกว่าอย่างมีนัยสำคัญ

โมเดลงานเสียงอินเฟอเรนซ์RTF
Parakeet TDT v3STT (114 ภาษา)1.5s175ms0.12
Kokoro 82MTTS (7 ภาษา)เอาต์พุต 1.9s1,075ms0.58
Silero VAD v5VADchunk 32ms<1ms<0.01
DeepFilterNet3การลดสัญญาณรบกวนchunk 32ms~5ms~0.15
แพลตฟอร์มการเร่งความเร็วชิปเซ็ต
AndroidNNAPISnapdragon 8 Gen 1+, Exynos 2200+, Google Tensor G2+
Linux แบบฝังตัวQNN (Hexagon DSP)SA8295P, SA8255P
ใด ๆCPU (XNNPACK)arm64-v8a / x86_64 ทั้งหมด
หมายเหตุ

Benchmark Android มาจากโปรแกรมจำลองที่ไม่มีการเร่งความเร็วด้วยฮาร์ดแวร์ บนฮาร์ดแวร์ Snapdragon จริงพร้อม delegation NNAPI คาดว่าอินเฟอเรนซ์จะเร็วขึ้น 2–3 เท่า ขนาดโมเดลทั้งหมด: ~1.2 GB (ONNX ที่ควอนไทซ์ INT8)