ユースケース · 会話型

音声を入力。
音声を出力。

音声優先インターフェースの 3 つの形 —— 単一のフルデュプレックス speech-to-speech モデル、完全に制御できる wake → VAD → ASR → LLM → TTS のコンポーザブル・パイプライン、ハンズフリー起動用のウェイクワード。すべてオンデバイス、クラウド API なし、音声はデバイスから出ません。

3 つのサブユースケース

プロダクトに合う形を選ぼう。

ドロップイン型の対話モデル、ステージごとに制御できるコンポーザブル・パイプライン、あるいは軽量なウェイクワード・トリガー。いずれも完全にオンデバイスで動作します。

さらに読む

コンポーネント別ガイド。