ドキュメント
ClonyVoiceのすべての機能の使い方を学びましょう。
はじめに
インストール
購入後、ダウンロードリンク(7日間有効)が記載されたメールが届きます。リンクの有効期限が切れた場合は、clonyvoice.comのアカウントにログインして新しいダウンロードリンクを生成してください。インストーラーはAIモデルを含むすべての必要なコンポーネントを自動的にセットアップします。
- 購入確認メールのダウンロードリンクをクリックするか、clonyvoice.comのアカウントにログインしてインストーラーをダウンロード
- .exeインストーラーを実行し、セットアップウィザードに従う
- インストールの完了を待つ(AIモデルのダウンロードのため数分かかる場合があります)
- デスクトップまたはスタートメニューからClonyVoiceを起動
ライセンスの有効化
ライセンスは初回起動時に自動的に有効化されます — インストーラーに個人用のアクティベーショントークンが含まれています。キーやメールアドレスの入力は不要です。この1回限りの有効化にはインターネット接続が必要です。各ライセンスは1台のマシンをカバーします。複数のライセンスを購入している場合、インストールごとにアカウントから利用可能なライセンスが自動的に割り当てられます。ライセンスを別のマシンに移動するには、clonyvoice.comのアカウントからそのマシンを無効化し、新しいマシンでインストーラーを再ダウンロードして再インストールしてください。
インターフェースの概要
インターフェースには7つのタブを持つ上部ナビゲーションバーがあります:Text to Audio(音声生成)、Create a voice(音声のクローンまたはデザイン)、Voice Changer(別の音声でオーディオを変換)、Transfer(音声のインポート/エクスポート)、API(開発者向けエンドポイントとキー)、Projects(生成履歴とモンタージュ)、License(アカウントとリファラル情報)。ヘッダーには言語セレクター、GPU/CPUモード切替、下部バーにシステム統計も表示されます。
音声クローン
音声クローンの仕組み
音声クローンは、オーディオサンプルから実在の声のデジタルモデルを作成します。クローンされると、この音声モデルは10の対応言語のいずれでもあらゆるテキストを読み上げることができます。
クイックモード
クイックモードは、オーディオサンプルから即座に音声クローンを作成します。テストやプレビューに最適です。
- 「Create a voice」タブに移動
- クローンモードで「Quick Mode」を選択
- オーディオサンプル(3〜60秒)をアップロードまたは録音
- 音声に名前を付けて「クローン」をクリック
- クローンされた音声が音声セレクターに表示され、すぐに使用可能
プレシスモード
プレシスモードは転写を使用してオーディオサンプルとテキスト内容を整合させ、より高品質な音声クローンを生成します。本番使用に推奨。
- 「Create a voice」タブに移動し、「Precise Mode」を選択
- オーディオサンプル(10〜60秒推奨)をアップロードまたは録音
- 転写が自動生成されます — 正確性のために編集可能
- 「クローン」をクリックして処理を待つ(30〜60秒)
- 高忠実度の音声モデルが完成
マルチサンプルクローン
最高の音声忠実度を得るには、同じ声の最大5つの異なるオーディオサンプルを組み合わせてください。AIがすべてのサンプルから学習し、より正確な音声モデルを作成します。
最良の結果を得るためのヒント
docs_vc_tips_text
- 背景ノイズの少ない静かな環境で使用する
- 一定の音量とマイクからの距離で録音する
- 多様なイントネーションを含める — 単調に読まない
- 長いサンプル(10〜30秒)は非常に短いものより良い結果をもたらす
- 音楽、他の話者、効果音が含まれるサンプルは避ける
ボイスデザイン
テキストからの音声作成
ボイスデザインでは、自然言語で説明することで全く新しい音声を作成できます。オーディオサンプルは不要です。
- 「Create a voice」タブに移動し、「Design」モードを選択
- 希望する音声の説明を入力(例:「穏やかなトーンの温かく深い男性の声」)
- 「生成」をクリックして音声を作成
- 生成された音声をプレビューし、必要に応じて再生成
- 満足したらライブラリに音声を保存
説明のヒント
docs_vd_tips_text
- 年齢、性別、ピッチ、トーンを説明する
- 必要に応じてアクセントや話し方のスタイルに言及する
- 具体的に:「エネルギッシュな若い女性」は「いい声」より効果的
- 複数のバリエーションを生成してお気に入りを選ぶ
テキスト読み上げ
音声の生成
音声(クローン、デザイン、または内蔵プリセット)を取得したら、「Text to Audio」タブであらゆるテキストから音声を生成できます。
- 音声セレクターから音声を選択
- 入力エリアにテキストを入力または貼り付け
- 出力言語を選択
- 必要に応じて感情プリセットを選択
- 「生成」をクリックして結果を聴く
- 生成されたオーディオは自動的に保存されます。WAV、MP3、またはMP4(動画)形式でエクスポートできます
感情プリセット
感情プリセットを適用して、生成された音声をより表現豊かにします。6つの感情が利用可能です:ニュートラル、ハッピー、アングリー、サッド、カーム、コンフィデント。各プリセットは音声のイントネーションと表現力を調整します。感情機能には1.7Bモデルが必要です — 0.6Bモデルではサポートされていません。
多言語出力
あらゆる音声が10の対応言語のいずれでも話すことができます。生成前に対象言語を選択するだけです。音声の特性は保持され、対象言語の発音に適応します。
インポート & エクスポート
音声モデルのエクスポート
Transferタブを使用して、バックアップや別のマシンへの転送のために音声モデルをエクスポートします。
- 「Transfer」タブに移動 — 音声がカテゴリ別にグループ化されて左側に表示されます
- チェックボックスでエクスポートしたい音声を選択
- 下部の「Export」をクリックし、保存場所を選択して.clonyvoiceファイルを保存
音声モデルのインポート
Transferタブを使用して、.clonyvoiceファイルやアーカイブ(.zip、.tar.gz、.7z)から音声モデルをインポートします。
- 「Transfer」タブに移動 — インポートパネルは右側にあります
- 「Choose a .clonyvoice file」をクリックしてファイルを選択
- 新規と重複の音声を示すプレビューを確認し、「Import」をクリック
トラブルシューティング
生成が遅い
生成が遅い場合、GPUモード(CUDA対応のNVIDIA GPUが必要)を使用しているか確認してください。他のGPU集約型アプリケーションを閉じてください。CPU専用モードでは、生成は自然に遅くなります。
音声品質が低い
クリーンなオーディオサンプル(10〜30秒)でプレシスモードを使用してください。背景ノイズを最小限にしてください。複数のサンプルで忠実度が向上します。音楽や複数の話者が含まれるサンプルは避けてください。
アプリケーションがクラッシュまたは起動しない
システム要件(Windows 11、16GB RAM)を確認してください。アンチウイルスがアプリケーションをブロックしていないか確認してください。問題が解決しない場合は、clonyvoice.comのアカウントからインストーラーを再ダウンロードして再インストールするか、サポートにお問い合わせください。
ライセンスの有効化の問題
ライセンスの有効化は自動的に行われます — インストーラーのファイル名に埋め込まれたトークンを使用します。この1回限りの有効化にはインターネット接続が必要です。有効化に失敗した場合は、clonyvoice.comのアカウントからインストーラーを再ダウンロードして再インストールしてください。ライセンスを別のマシンに移行するには、まずアカウントダッシュボードから現在のマシンを無効化してください。