เริ่มต้น — Windows

speech-core บิลด์แบบเนทีฟบน Windows x86_64 — เป็น engine C++17 ตัวเดียวกับที่ขับเคลื่อน Android และ Linux แบ็กเอนด์การอนุมานทั้งสองทำงานบน Windows ได้: LiteRT (ทดสอบใน CI ทุกการเปลี่ยนแปลง) และ ONNX Runtime ครอบคลุมการถอดเสียงเป็นข้อความแบบสตรีมมิ่ง (Nemotron, Parakeet) การตรวจจับกิจกรรมเสียงพูด การแยกผู้พูด การฝังตัวผู้พูด และการสังเคราะห์เสียงพูดด้วย VoxCPM2 พร้อมการโคลนเสียง — ทั้งหมดทำงานในเครื่อง ดูตารางโมเดลฉบับเต็มได้ที่หน้า Speech Core

ข้อกำหนด

บิลด์ด้วยแบ็กเอนด์ LiteRT

รันจากสภาพแวดล้อมนักพัฒนา MSVC (เช่น เปิด Git Bash จาก x64 Native Tools Command Prompt) เพื่อให้ dumpbin และ lib อยู่บน PATH — สคริปต์ติดตั้งใช้เครื่องมือเหล่านี้สร้าง import library (libLiteRt.lib) จาก DLL ของรันไทม์ ซึ่ง wheel ของ Google ไม่ได้ให้มาด้วย:

git clone https://github.com/soniqo/speech-core.git
cd speech-core
./scripts/fetch_litert.sh "$PWD/litert"

cmake -B build \
    -DCMAKE_BUILD_TYPE=Release \
    -DSPEECH_CORE_WITH_LITERT=ON \
    -DLITERT_DIR=$PWD/litert
cmake --build build --parallel --config Release

Windows ค้นหา DLL ผ่าน PATH ดังนั้นให้เพิ่มไดเรกทอรี litert ไว้หน้าสุดของ PATH ก่อนรันสิ่งใดก็ตามที่โหลดแบ็กเอนด์:

export PATH="$PWD/litert:$PATH"
ctest --test-dir build --output-on-failure -C Release

บิลด์ด้วยแบ็กเอนด์ ONNX Runtime

อีกทางเลือกหนึ่ง (หรือเปิดเพิ่มควบคู่กัน) คือเปิดใช้แบ็กเอนด์ ONNX โดยตั้ง ORT_DIR ให้ชี้ไปยังรีลีส onnxruntime-win-x64 ที่แตกไฟล์แล้ว สามารถเปิดการเร่งความเร็วด้วย NVIDIA CUDA / TensorRT (ไม่บังคับ) ได้ผ่าน -DSPEECH_CORE_WITH_CUDA=ON — ควบคุมตอนรันไทม์ด้วย SPEECH_CORE_ORT_PROVIDER พร้อม fallback ไปที่ CPU โดยอัตโนมัติ — และเป็นเป้าหมายสำหรับเสียงพูดสู่เสียงพูดแบบ full-duplex ของ PersonaPlex 7B:

cmake -B build \
    -DCMAKE_BUILD_TYPE=Release \
    -DSPEECH_CORE_WITH_ONNX=ON \
    -DORT_DIR=C:/path/to/onnxruntime-win-x64
cmake --build build --parallel --config Release
การโคลนเสียงพร้อมใช้ทันที

CLI สำหรับการโคลนเสียง (speech_voxcpm2_clone) จะถูกบิลด์อัตโนมัติทุกครั้งที่ SPEECH_CORE_WITH_LITERT=ON — ดู examples/litert ถ้าชอบ GUI มากกว่า Speech Studio มีตัวติดตั้งสำหรับ Windows ที่ใช้ engine VoxCPM2 ตัวเดียวกัน

ขั้นตอนถัดไป