IT技术分享

关注互联网、科技、编程等技术，为IT技术人提供最全面的IT资讯

GPT-SoVITS V2版，业界最强的AI声音克隆软件

作者: ma
时间: 2026-04-18
分类: 大模型

项目地址：https://github.com/RVC-Boss/GPT-SoVITS

说下V2版本的更新：新增两种语种，现在支持中、英、日、韩、粤物种语种，现在1分钟的参考音频就能训练出很好的效果。
对中英多音字做了优化，解决了旧版吞字的问题，情绪化复刻效果更加逼真了。

其他更多的效果大家自行体验，使用和之前的老版本类似。

软件下载后，解压出来，建议解压到非中文目录下，切记！
在所有操作前，准备好需要克隆的声音素材，要求无杂音，吐齿清晰，1-3分钟左右即可。
素材的质量，决定合成的效果。

解压后，双击 go-webui.bat，或完成环境配置和依赖安装后，在终端中输入 python webui.py 即可启动项目。（Windows系统）
访问地址：http://localhost:9874

UI最上方有官方的使用教程手册，想系统的学习可以参考：https://www.yuque.com/baicaigongchang1145haoyuangong/ib3g1e

Windows整合包
https://www.yuque.com/baicaigongchang1145haoyuangong/ib3g1e/dkxgpiy9zb96hob4
GPT-SoVITS整合包使用说明
首先上传3-10秒的参考音频。

然后在参考音频的文本里输入音频样本的文字内容，不输入音频文本的话，效果会差些，尽量输入。

然后输入需要合成的文本，点击合成语音按钮。

标签: none

添加新评论

上一篇: GPT-SoVITS初探
下一篇: 为硬件保留的内存怎么释放