项目地址:https://github.com/RVC-Boss/GPT-SoVITS

说下V2版本的更新:新增两种语种,现在支持中、英、日、韩、粤物种语种,现在1分钟的参考音频就能训练出很好的效果。
对中英多音字做了优化,解决了旧版吞字的问题,情绪化复刻效果更加逼真了。

其他更多的效果大家自行体验,使用和之前的老版本类似。

软件下载后,解压出来,建议解压到非中文目录下,切记!
在所有操作前,准备好需要克隆的声音素材,要求无杂音,吐齿清晰,1-3分钟左右即可。
素材的质量,决定合成的效果。

解压后,双击 go-webui.bat,或完成环境配置和依赖安装后,在终端中输入 python webui.py 即可启动项目。(Windows系统)
访问地址:http://localhost:9874

UI最上方有官方的使用教程手册,想系统的学习可以参考:https://www.yuque.com/baicaigongchang1145haoyuangong/ib3g1e

Windows整合包
https://www.yuque.com/baicaigongchang1145haoyuangong/ib3g1e/dkxgpiy9zb96hob4
GPT-SoVITS整合包使用说明
首先上传3-10秒的参考音频。

然后在参考音频的文本里输入音频样本的文字内容,不输入音频文本的话,效果会差些,尽量输入。

然后输入需要合成的文本,点击合成语音按钮。

标签: none

添加新评论