유스케이스 · 대화형

음성 입력.
음성 출력.

음성 우선 인터페이스의 세 가지 형태 —— 단일 풀듀플렉스 speech-to-speech 모델, 단계마다 완전한 제어가 가능한 wake → VAD → ASR → LLM → TTS 컴포저블 파이프라인, 그리고 핸즈프리 진입용 웨이크 워드 활성화. 모두 온디바이스, 클라우드 API 없음, 오디오는 기기 밖으로 나가지 않음.

데스크톱 앱

Studio는 목소리를 만들고, Runner는 그 목소리로 대화합니다.

Speech Studio와 Runner는 같은 로컬 음성 스택의 두 얼굴입니다. 하나는 음성 제작용, 하나는 실시간 음성 에이전트 상호작용용입니다.

세 가지 하위 유스케이스

제품에 맞는 형태를 고르세요.

드롭인 대화 모델, 단계별 제어가 가능한 컴포저블 파이프라인, 또는 가벼운 웨이크 워드 트리거. 모두 전적으로 온디바이스에서 동작합니다.

더 깊이 읽기

컴포넌트 가이드.