一个强大的音色克隆模型,可以用少量的语音数据来训练和转换不同的声音。
一、软件介绍
它支持中文、英文和日文的语音合成,可以实现零样本和少样本的文本到语音转换。
它还提供了一个WebUI工具,集成了语音伴奏分离、自动训练集分割、中文ASR和文本标注等功能,帮助用户创建训练数据集和GPT/SoVITS模型。
特性:
- 零样本 TTS:输入 5 秒的人声样本,体验即时文本到语音转换;
- 少量样本 TTS:仅使用 1 分钟的训练数据即可微调模型,提高语音相似度和逼真度;
- 跨语言支持:使用与训练数据集不同的语言进行推理,目前支持英语、日语和中文;
- WebUI工具:集成了语音伴奏分离、自动训练集分割、中文ASR、文本标注等功能,帮助初学者创建训练数据集和GPT/SoVITS模型;
如果是Windows用户(使用 win>=10 进行测试),您可以直接通过预压缩进行安装。只需下载预压缩,解压并双击 go-webui.bat 即可启动 GPT-SoVITS-WebUI。
二、在线演示
在线演示视频: 耗时两个月自主研发的低成本AI音色克隆软件,免费送给大家!;
三、项目地址
Github: https://github.com/RVC-Boss/GPT-SoVITS;
最新评论
我的是ipv4网络,如何使用直播源啊!
我今天试了,不想啊,我的是新疆昌吉移动的网络。
收不到验证码电报
现在充值29起了