多语言音色克隆是一款聚焦人声复制与跨语言输出的智能工具,用户只需录制十秒以上的清晰语音,就能生成专属的声纹模型。完成克隆后,无论输入哪种语言的文本,系统都会自动用原声风格朗读并输出对应语言的内容。该平台提供离线克隆和在线云端两种运行模式,其中离线模式既能保障隐私安全,又无需依赖网络连接。对于自媒体创作者而言,借助克隆音色可以批量制作视频配音文件,有效缩短后期制作的时间成本。
1、打开多语言音色克隆的主界面,点击底部那个橙色的加号按钮,就能进入新建音频的编辑页面。
2、在新建音频页面,既可以选择已有的音色,也能在输入框中填写需要进行克隆的文本内容。
3、点击“请选择音色”区域进入音色选择页面,既可以选用示例音色,也可以点击“创建音色”按钮。
4、进入创建音色页面后,长按麦克风按钮录制声音,录制完成就能生成专属的克隆音色。
1、仅需十秒录音采样就能完成基础克隆模型的构建,录制时长越久,模型对原声音的还原精准度就越高。
2、处于离线模式时,所有运算都在本地完成,即便是在飞行状态下,克隆功能依旧能正常使用。
3、云端模式支持跨设备同步克隆模型,录制完成后能在平板端直接调用并进行合成。
4、视频配音批量生成功能可按段落对文本进行分割,每一段落都会输出独立的语音文件,便于后续剪辑操作。
5、产品说明的语音输出功能支持添加开头与结尾的背景音乐,相关音乐文件需提前存储至本地。
1、模型管理页面会展示克隆模型的还原度评分,当评分达到九十分以上时,系统会为该模型标注高保真标签。
2、支持离线与在线两种模式的实时切换,无需重启应用,切换后系统会自动保存当前的编辑进度。
3、跨设备同步功能的使用条件是两台设备需登录同一个账号,模型在传输过程中会采用点对点加密的方式。
4、添加背景音乐后可对音量比例进行调整,语音和音乐的音量比值能够设置为七比三。
5、合成历史里的语音文件支持二次编辑,修改文本后不用重新消耗字符就能直接输出。
下载排行