常见问题
关于ClonyVoice您需要了解的一切。
通用
ClonyVoice是一款Windows桌面应用程序,可让您克隆声音、通过文字描述设计新声音,并以10种语言生成语音。它在您的计算机上100%本地运行,无需互联网,数据不会发送到云端。
您提供一段简短的音频样本(最少3秒),ClonyVoice会分析声音特征——音色、音高、口音和音质。AI随后创建一个语音模型,可以用该声音朗读任何文本。提供两种模式:快速模式(即时结果)和精确模式(带转录的录音棚级品质)。
可以!安装后,语音克隆和语音生成100%在本地运行 — 音频处理无需互联网连接,您的数据永远不会离开您的计算机。仅许可证验证需要定期的短暂网络连接。
内置10种语言:英语、法语、德语、西班牙语、意大利语、葡萄牙语、俄语、日语、韩语和中文。克隆的声音可以用这些语言中的任何一种说话,无论原始样本是什么语言。
绝对安全。所有操作都在您的设备上本地运行。音频样本、语音模型或生成的语音永远不会上传到任何服务器。您的数据始终保留在您的计算机上。
语音克隆
快速模式下,克隆几乎是即时的(几秒钟)。精确模式下,根据样本长度和硬件配置,需要30-60秒。结果是一个可无限次使用的可复用语音模型。
没有背景噪音的清晰语音效果最佳。在安静的房间里用合适的麦克风录制是理想的。样本应只包含您想克隆的声音,避免音乐或多个说话者。
一次语音克隆最多可组合5个音频样本。样本越多,AI学习的声音特征越多,通常意味着更高的保真度。
快速模式从原始音频即时创建语音克隆。精确模式使用转录将音频与文本对齐,产生更准确、更自然的克隆。快速预览用快速模式,制作级品质用精确模式。
可以!从英语样本克隆的声音可以说法语、德语、日语或10种支持语言中的任何一种。AI在保留声音特征的同时适应目标语言。
功能
语音设计让您通过文字描述创建全新的声音。例如:"一个带有轻微英国口音的温暖深沉的男性声音。"AI会生成匹配您描述的独特声音,无需音频样本。
Voice Store是一个社区市场,用户可以在这里浏览、下载和分享语音模型。您可以找到适用于各种用途的预制声音,也可以与社区分享您的创作。
ClonyVoice支持以下情感预设:快乐、悲伤、愤怒、恐惧、厌恶、惊讶和耳语。您可以将这些应用于任何声音,为生成的语音增添表现力。
可以。您可以导出语音模型进行分享或备份,也可以导入其他用户的模型。兼容标准语音模型文件格式。
技术
Windows 11,64位,至少16GB内存(不支持Windows 10)。存储空间:应用程序约需20GB。为获得最佳性能,建议使用支持CUDA的NVIDIA GPU(RTX系列或GTX 1060+)。纯CPU模式可用但速度较慢。
不需要,但建议使用。有NVIDIA GPU(CUDA),语音生成速度快5-10倍。纯CPU模式适用于任何现代Intel或AMD处理器,但每次生成耗时更长。AMD和Intel GPU不支持加速。
购买后,您会收到许可证密钥和下载链接。运行安装程序,首次启动时输入许可证密钥即可开始使用。安装程序会自动处理所有依赖项。
ClonyVoice在启动时检查更新(需要互联网连接)。凭借终身许可证,更新永久免费。您也可以从账户面板下载最新版本。
许可证与商业使用
可以,商业使用已包含在您的许可证中。您拥有生成的所有音频的完整权利。请确保您已获得克隆真实人物声音的许可。
每个许可证允许在最多2台设备上同时激活。您可以从账户面板停用设备以释放名额。
是的!终身许可证包含所有未来更新,无需额外费用。新功能、新语言和改进全部包含。
我们为所有购买提供14天退款保障。如果您因任何原因不满意,只需登录您的账户并联系我们的支持团队即可获得全额退款。无任何条件。
故障排除
尝试使用更长、更清晰的音频样本(10-30秒)的精确模式。确保原始样本的背景噪音最小。使用多个样本也能显著提高质量。
如果您使用纯CPU模式,生成自然会较慢。为获得更快的结果,请使用支持CUDA的NVIDIA GPU。同时,在生成音频时请关闭其他资源密集型应用程序。
请确保满足最低系统要求(Windows 11,16GB内存)。尝试以管理员身份运行。如果问题持续存在,请重新安装或联系支持团队。