文档
学习如何使用ClonyVoice的每项功能。
入门
安装
购买后,您将收到一封包含下载链接的邮件(有效期7天)。如果链接已过期,请登录clonyvoice.com的账户生成新的下载链接。安装程序会自动设置所有必需的组件,包括AI模型。
- 点击购买确认邮件中的下载链接,或登录clonyvoice.com的账户下载安装程序
- 运行.exe安装程序并按照安装向导操作
- 等待安装完成(下载AI模型可能需要几分钟)
- 从桌面或开始菜单启动ClonyVoice
许可证激活
许可证在首次启动时自动激活 — 安装程序包含您的个人激活令牌。无需输入密钥或邮箱。此一次性激活需要互联网连接。每个许可证覆盖一台机器。如果您购买了多个许可证,每次安装会自动使用账户中的可用许可证。如需将许可证转移到其他机器,请在clonyvoice.com的账户中停用该机器,然后在新机器上重新下载并安装。
界面概览
界面顶部有一个包含7个标签页的导航栏:Text to Audio(生成语音)、Create a voice(克隆或设计声音)、Voice Changer(用不同声音转换音频)、Transfer(导入/导出声音)、API(开发者端点和密钥)、Projects(生成历史和剪辑)和License(账户和推荐信息)。顶部还包括语言选择器、GPU/CPU模式切换,底部栏显示系统统计信息。
语音克隆
语音克隆的工作原理
语音克隆从音频样本创建真实声音的数字模型。克隆完成后,该语音模型可以用10种支持语言中的任何一种朗读任何文本。
快速模式
快速模式从音频样本即时创建语音克隆。适合测试和预览声音。
- 进入"Create a voice"标签页
- 选择"Quick Mode"作为克隆模式
- 上传或录制音频样本(3-60秒)
- 为声音命名并点击"克隆"
- 克隆的声音出现在声音选择器中,随时可用
精确模式
精确模式使用转录将音频样本与文本内容对齐,生成更高质量的语音克隆。推荐用于正式制作。
- 进入"Create a voice"标签页并选择"Precise Mode"
- 上传或录制音频样本(建议10-60秒)
- 转录自动生成——您可以编辑以提高准确性
- 点击"克隆"并等待处理(30-60秒)
- 高保真语音模型完成
多样本克隆
为获得最佳声音保真度,可组合同一声音的最多5个不同音频样本。AI将从所有样本中学习,创建更准确的语音模型。
获得最佳效果的提示
docs_vc_tips_text
- 在背景噪音最小的安静环境中使用
- 保持一致的音量和与麦克风的距离
- 包含多样的语调——不要用单调的方式朗读
- 较长的样本(10-30秒)比非常短的样本效果更好
- 避免包含音乐、其他说话者或声音效果的样本
语音设计
通过文字创建声音
语音设计让您通过自然语言描述创建全新的声音。无需音频样本。
- 进入"Create a voice"标签页并选择"Design"模式
- 输入您想要的声音描述(例如:"一个音调平和的温暖深沉男性声音")
- 点击"生成"创建声音
- 预览生成的声音,如需要可重新生成
- 满意后将声音保存到库中
描述提示
docs_vd_tips_text
- 描述年龄、性别、音高和音调
- 如需要可提及口音或说话风格
- 要具体:"充满活力的年轻女性"比"好听的声音"效果更好
- 生成多个变体并选择您最喜欢的
文字转语音
生成语音
拥有声音(克隆、设计或内置预设)后,您可以在"Text to Audio"标签页中将任何文本生成为语音。
- 从声音选择器中选择一个声音
- 在输入区域输入或粘贴文本
- 选择输出语言
- 可选择情感预设
- 点击"生成"并听取结果
- 生成的音频会自动保存。您可以导出为WAV、MP3或MP4(视频)格式
情感预设
应用情感预设使生成的语音更具表现力。提供六种情感:中性、快乐、愤怒、悲伤、平静和自信。每个预设会调整声音的语调和表现力。情感功能需要1.7B模型 — 0.6B模型不支持此功能。
多语言输出
任何声音都可以用10种支持语言中的任何一种说话。只需在生成前选择目标语言。声音特征保持不变,同时适应目标语言的发音。
导入与导出
导出语音模型
使用Transfer标签页导出语音模型,用于备份或转移到另一台机器。
- 进入"Transfer"标签页 — 您的声音按类别分组显示在左侧
- 使用复选框选择要导出的声音
- 点击底部的"Export",选择保存位置,保存.clonyvoice文件
导入语音模型
使用Transfer标签页从.clonyvoice文件或压缩包(.zip、.tar.gz、.7z)导入语音模型。
- 进入"Transfer"标签页 — 导入面板在右侧
- 点击"Choose a .clonyvoice file"并选择您的文件
- 查看显示新声音和重复声音的预览,然后点击"Import"
故障排除
生成速度慢
如果生成速度慢,请确保使用GPU模式(需要支持CUDA的NVIDIA GPU)。关闭其他GPU密集型应用程序。在纯CPU模式下,生成自然会较慢。
声音质量差
使用清晰的音频样本(10-30秒)的精确模式。最大程度减少背景噪音。多个样本可提高保真度。避免包含音乐或多个说话者的样本。
应用程序崩溃或无法启动
验证系统要求(Windows 11,16GB内存)。确保杀毒软件没有阻止应用程序。如果问题持续存在,请从clonyvoice.com的账户重新下载安装程序并重新安装,或联系支持团队。
许可证激活问题
许可证激活是自动的 — 使用嵌入在安装程序文件名中的令牌。此一次性激活需要互联网连接。如果激活失败,请从clonyvoice.com的账户重新下载安装程序并重新安装。要将许可证转移到另一台机器,请先在账户面板中停用当前机器。