Başlangıç — Windows

speech-core, Windows x86_64 üzerinde doğal olarak derlenir — Android ve Linux'u çalıştıran aynı C++17 motoru. Her iki çıkarım backend'i de Windows'ta çalışır: LiteRT (her değişiklikte CI'da test edilir) ve ONNX Runtime. Bu, akışlı konuşmadan metne (Nemotron, Parakeet), ses etkinliği algılama, konuşmacı ayrıştırma, konuşmacı embedding'leri ve ses klonlamalı VoxCPM2 metinden konuşmayı kapsar — tamamı yerel olarak çalışır. Tam model matrisi için Speech Core sayfasına bakın.

Gereksinimler

LiteRT backend'i ile derleme

dumpbin ve lib PATH'te olacak şekilde bir MSVC geliştirici ortamından çalıştırın (örneğin Git Bash'i x64 Native Tools Command Prompt içinden başlatın) — kurulum betiği bunları, Google'ın wheel'inin içermediği import kütüphanesini (libLiteRt.lib) çalışma zamanı DLL'inden üretmek için kullanır:

git clone https://github.com/soniqo/speech-core.git
cd speech-core
./scripts/fetch_litert.sh "$PWD/litert"

cmake -B build \
    -DCMAKE_BUILD_TYPE=Release \
    -DSPEECH_CORE_WITH_LITERT=ON \
    -DLITERT_DIR=$PWD/litert
cmake --build build --parallel --config Release

Windows, DLL'leri PATH üzerinden çözümler; bu yüzden backend'i yükleyen herhangi bir şeyi çalıştırmadan önce litert dizinini PATH'in başına ekleyin:

export PATH="$PWD/litert:$PATH"
ctest --test-dir build --output-on-failure -C Release

ONNX Runtime backend'i ile derleme

Alternatif olarak (veya ek olarak), ORT_DIR'i ayıklanmış bir onnxruntime-win-x64 sürümüne işaret edecek şekilde ayarlayıp ONNX backend'ini etkinleştirin. İsteğe bağlı NVIDIA CUDA / TensorRT hızlandırması -DSPEECH_CORE_WITH_CUDA=ON ile kullanılabilir — SPEECH_CORE_ORT_PROVIDER ile çalışma zamanında denetlenir ve sessizce CPU'ya geri döner — ve PersonaPlex 7B tam çift yönlü konuşmadan konuşmanın hedefidir:

cmake -B build \
    -DCMAKE_BUILD_TYPE=Release \
    -DSPEECH_CORE_WITH_ONNX=ON \
    -DORT_DIR=C:/path/to/onnxruntime-win-x64
cmake --build build --parallel --config Release
Kutudan çıktığı gibi ses klonlama

SPEECH_CORE_WITH_LITERT=ON olduğunda bir ses klonlama CLI'ı (speech_voxcpm2_clone) otomatik olarak derlenir — bkz. examples/litert. GUI mi tercih ediyorsunuz? Speech Studio, aynı VoxCPM2 motoruna sahip bir Windows yükleyicisiyle gelir.

Sonraki Adımlar