Chatterbox Multilingual

この Soniqo ページは、ローカルの speech-swift / speech-core 実装にある Chatterbox Multilingual を説明します。Hugging Face バンドルへのリンクは統合メモの後にあります。

まずサイト内ページへ

ランディングカードとドキュメントメニューは先にこのページへ向け、ソースモデルとバンドルのリンクは本ページ内に残します。

概要

モデルChatterbox Multilingual
役割Multilingual zero-shot voice-cloning TTS
バックエンドMLX fp16 on Apple; LiteRT default-voice runtime in Speech Core
出力24 kHz mono waveform
言語23 languages
ライセンスMIT
状態MLX cloning runtime; LiteRT greedy/default-voice runtime for edge deployments
ソースResemble AI Chatterbox
Swift プロダクトChatterboxTTS
CLI / ランタイムProgrammatic speech-swift runtime; LiteRT example CLI in speech-core/examples/litert

使い方

以下のスニペットは、現在の speech-swift リポジトリが公開している API またはコマンドに合わせています。

import ChatterboxTTS

let model = try await ChatterboxTTSModel.fromPretrained()
let pcm = try model.clone(
    referenceSamples: reference,
    sampleRate: 24_000,
    text: "The cloned voice now speaks a new sentence.",
    languageId: "en"
)

モデルリンク

実装メモ