よくある質問
ClonyVoiceについて知りたいことのすべて。
一般
ClonyVoiceは、音声のクローン、テキスト記述からの新しい音声作成、10言語での音声生成が可能なWindows用デスクトップアプリケーションです。コンピューター上で100%ローカルに動作し、インターネット不要、データはクラウドに送信されません。
短いオーディオサンプル(最短3秒)を提供すると、ClonyVoiceが音声の特性(トーン、ピッチ、アクセント、音色)を分析します。AIがその音声であらゆるテキストを読み上げられる音声モデルを作成します。クイックモード(即時結果)とプレシスモード(転写付きスタジオ品質)の2つのモードがあります。
はい!インストール後、音声クローンと音声生成は100%ローカルで動作します — オーディオ処理にインターネット接続は不要で、データがコンピューターの外に出ることはありません。ライセンス認証のためにのみ、定期的な短いインターネット接続が必要です。
10言語が内蔵されています:英語、フランス語、ドイツ語、スペイン語、イタリア語、ポルトガル語、ロシア語、日本語、韓国語、中国語。クローンされた音声は、元のサンプルの言語に関係なく、これらすべての言語で話すことができます。
もちろんです。すべてがお使いのマシン上でローカルに動作します。オーディオサンプル、音声モデル、生成された音声がサーバーにアップロードされることはありません。データはあなたのコンピューター上に留まります。
音声クローン
クイックモードでは、クローンはほぼ瞬時(数秒)です。プレシスモードでは、サンプルの長さとハードウェアに応じて30〜60秒かかります。結果は無制限に使用できる再利用可能な音声モデルです。
背景ノイズのないクリアな音声が最良の結果をもたらします。適切なマイクを使用した静かな部屋での録音が理想的です。サンプルにはクローンしたい声だけが含まれている必要があります。音楽や複数の話者は避けてください。
1つの音声クローンに最大5つのオーディオサンプルを組み合わせることができます。サンプルが多いほど、AIがより多くの音声特性を学習できるため、一般的に高い忠実度が得られます。
クイックモードは生の音声から即座に音声クローンを作成します。プレシスモードは転写を使用して音声とテキストを整合させ、より正確で自然な音声クローンを生成します。素早いプレビューにはクイック、本番品質にはプレシスをお使いください。
はい!英語のサンプルからクローンされた音声は、フランス語、ドイツ語、日本語、その他の10の対応言語で話すことができます。AIは音声の特性を保持しながら、対象言語に適応します。
機能
ボイスデザインでは、テキストで説明することで全く新しい音声を作成できます。例:「軽いイギリスアクセントの温かく深い男性の声」。AIがあなたの説明に合った独自の音声を生成します。オーディオサンプルは不要です。
Voice Storeは、ユーザーが音声モデルを閲覧、ダウンロード、共有できるコミュニティマーケットプレイスです。さまざまな用途の既製音声を見つけたり、独自の作品をコミュニティと共有できます。
ClonyVoiceは以下の感情プリセットをサポートしています:喜び、悲しみ、怒り、恐怖、嫌悪、驚き、ささやき。これらをあらゆる音声に適用して、生成された音声にニュアンスを加えることができます。
はい。音声モデルをエクスポートして共有やバックアップができ、他のユーザーからモデルをインポートすることもできます。標準的な音声モデルファイルフォーマットに対応しています。
技術
Windows 11、64ビット、RAM 16GB以上(Windows 10は非対応)。ストレージ:アプリケーション用に約20GB。最高のパフォーマンスには、CUDA対応のNVIDIA GPU(RTXシリーズまたはGTX 1060以上)を推奨します。CPU専用モードも利用可能ですが、速度は遅くなります。
いいえ、ただし推奨されます。NVIDIA GPU(CUDA)があれば、音声生成は5〜10倍高速になります。CPU専用モードは最新のIntelまたはAMDプロセッサで動作しますが、生成に時間がかかります。AMDおよびIntel GPUはアクセラレーションには対応していません。
購入後、ライセンスキーとダウンロードリンクを受け取ります。インストーラーを実行し、初回起動時にライセンスキーを入力すれば準備完了です。インストーラーがすべての依存関係を自動的に処理します。
ClonyVoiceは起動時にアップデートを確認します(インターネット接続がある場合)。永久ライセンスにより、アップデートは永久に無料です。アカウントダッシュボードから最新バージョンをダウンロードすることもできます。
ライセンス & 商用利用
はい、商用利用はライセンスに含まれています。生成したすべてのオーディオの完全な権利を所有できます。実在の人物の音声をクローンする場合は、許可を得ていることをご確認ください。
各ライセンスでは最大2台のマシンで同時にアクティベーションが可能です。アカウントダッシュボードからマシンを非アクティベーションしてスロットを空けることができます。
はい!永久ライセンスには、追加費用なしで将来のすべてのアップデートが含まれています。新機能、新言語、改善のすべてが含まれます。
すべての購入に14日間の返金保証を提供しています。何らかの理由でご満足いただけない場合は、アカウントにログインしてサポートチームにご連絡ください。全額返金いたします。無条件です。
トラブルシューティング
より長くクリーンなオーディオサンプル(10〜30秒)でプレシスモードをお試しください。元のサンプルの背景ノイズを最小限にしてください。複数のサンプルを使用すると品質が大幅に向上します。
CPU専用モードを使用している場合、生成は自然に遅くなります。より高速な結果には、CUDA対応のNVIDIA GPUをお使いください。また、オーディオ生成中は他のリソース集約型アプリケーションを閉じてください。
最低システム要件(Windows 11、16GB RAM)を満たしているか確認してください。管理者として実行してみてください。問題が解決しない場合は、再インストールするかサポートにお問い合わせください。