一个基于VITS的简单易用的变声框架
Go to file
2023-06-18 04:08:57 +00:00
.github/workflows fix unitest 2023-05-17 13:32:25 +08:00
configs Add files via upload 2023-03-31 17:49:09 +08:00
docs add vocal2guitar online demo 2023-06-11 13:59:16 +00:00
i18n English Translation Fixes (#402) 2023-06-01 10:11:38 +08:00
infer upload RVC v2 index training script (#343) 2023-05-24 12:26:35 +00:00
infer_pack Onnx推理dml支持 (#556) 2023-06-17 14:49:16 +00:00
logs/mute Add files via upload 2023-05-14 16:08:37 +08:00
pretrained 删除无用文件,增加--colab启动选项 2023-04-01 15:02:53 +08:00
pretrained_v2 Create .gitignore 2023-05-14 07:16:47 +00:00
train Fixed NameError coming from a typo. (#458) 2023-06-07 10:12:06 +08:00
uvr5_pack Format code (#366) 2023-05-28 16:06:11 +00:00
uvr5_weights 删除无用文件,增加--colab启动选项 2023-04-01 15:02:53 +08:00
weights 删除无用文件,增加--colab启动选项 2023-04-01 15:02:53 +08:00
.gitignore fix: train step2a & add arg --port --pycmd --noparallel 2023-04-01 16:42:19 +08:00
app.py Format code (#409) 2023-06-03 08:22:46 +00:00
Changelog_CN.md Update Changelog_CN.md 2023-06-13 16:22:17 +08:00
Changelog_EN.md Update Changelog_EN.md 2023-05-28 15:58:23 +00:00
Changelog_KO.md Update Changelog_KO.md (#381) 2023-05-30 08:35:12 +09:00
config.py Format code (#330) 2023-05-21 19:19:53 +08:00
Dockerfile add ability to containerize with Docker (add Dockerfile) (#240) 2023-05-07 13:32:16 +08:00
envfilescheck.bat undate envfilescheck.bat (#368) 2023-05-28 16:21:50 +00:00
export_onnx.py Format code (#330) 2023-05-21 19:19:53 +08:00
extract_f0_print.py Replace deprecated Numpy function np.int. (#434) 2023-06-10 14:55:34 +00:00
extract_feature_print.py fix workflow (#284) 2023-05-15 13:11:01 +08:00
extract_locale.py fix: json format (#84) 2023-04-17 12:49:29 +00:00
go-realtime-gui.bat Add files via upload 2023-04-16 18:56:20 +08:00
go-web.bat Add files via upload 2023-04-27 23:34:03 +08:00
gui.py Update gui.py default config (#482) 2023-06-08 13:29:34 +00:00
i18n.py Format code (#330) 2023-05-21 19:19:53 +08:00
infer_batch_rvc.py Format code (#522) 2023-06-14 11:48:05 +00:00
infer_uvr5.py Format code (#455) 2023-06-06 14:35:35 +00:00
infer-web.py Onnx推理dml支持 (#556) 2023-06-17 14:49:16 +00:00
LICENSE Initial commit 2023-03-27 17:59:11 +08:00
MDXNet.py Format code (#455) 2023-06-06 14:35:35 +00:00
my_utils.py Format code (#142) 2023-04-24 20:35:56 +08:00
onnx_inference_demo.py Format code (#384) 2023-05-30 15:22:53 +08:00
poetry.lock Bump starlette from 0.26.1 to 0.27.0 (#390) 2023-05-30 08:09:34 +00:00
pyproject.toml fix python dependency problem (#418) 2023-06-03 07:00:50 +00:00
README.md Update README.md 2023-06-11 13:56:06 +00:00
requirements-win-for-realtime_vc_gui.txt Fix GUI i18n (#38) 2023-04-12 14:28:28 +08:00
requirements.txt Update requirements.txt 2023-06-18 04:08:28 +00:00
Retrieval_based_Voice_Conversion_WebUI_v2.ipynb Update Retrieval_based_Voice_Conversion_WebUI_v2.ipynb (#448) 2023-06-06 12:14:04 +00:00
Retrieval_based_Voice_Conversion_WebUI.ipynb Update Retrieval_based_Voice_Conversion_WebUI.ipynb 2023-06-18 04:08:57 +00:00
slicer2.py Reformat and rewrite _get_name_params (#57) 2023-04-15 11:44:24 +00:00
train_nsf_sim_cache_sid_load_pretrain.py Add support for train without specify pretrained model, add support for selecting v2 48k as training setting, and add support for auto remove pretrained model when the user do not have pretrained model in designate folder. (#528) 2023-06-15 10:21:58 +08:00
trainset_preprocess_pipeline_print.py bugfix: leaked semaphore error (#309) 2023-05-19 17:56:06 +08:00
vc_infer_pipeline.py Format code (#366) 2023-05-28 16:06:11 +00:00
使用需遵守的协议-LICENSE.txt fix: train step2a & add arg --port --pycmd --noparallel 2023-04-01 16:42:19 +08:00

Retrieval-based-Voice-Conversion-WebUI

一个基于VITS的简单易用的语音转换变声器框架

madewithlove


Open In Colab Licence Huggingface

Discord

更新日志 | 常见问题解答 | AutoDL·5毛钱训练AI歌手 | 对照实验记录


English | 中文简体 | 日本語 | 한국어 (韓國語)

🔥 使用了RVC变声器训练的人声转木吉他模型在线demo🔥 https://huggingface.co/spaces/lj1995/vocal2guitar

🔥 RVC人声转吉他效果展示视频🔥 https://www.bilibili.com/video/BV19W4y1D7tT/

点此查看我们的演示视频 !

使用了RVC的实时语音转换: w-okada/voice-changer

底模使用接近50小时的开源高质量VCTK训练集训练无版权方面的顾虑请大家放心使用

后续会陆续加入高质量有授权歌声训练集训练底模

简介

本仓库具有以下特点

  • 使用top1检索替换输入源特征为训练集特征来杜绝音色泄漏
  • 即便在相对较差的显卡上也能快速训练
  • 使用少量数据进行训练也能得到较好结果(推荐至少收集10分钟低底噪语音数据)
  • 可以通过模型融合来改变音色(借助ckpt处理选项卡中的ckpt-merge)
  • 简单易用的网页界面
  • 可调用UVR5模型来快速分离人声和伴奏

环境配置

推荐使用poetry配置环境。

以下指令需在Python版本大于3.8的环境中执行:

# 安装Pytorch及其核心依赖若已安装则跳过
# 参考自: https://pytorch.org/get-started/locally/
pip install torch torchvision torchaudio

#如果是win系统+Nvidia Ampere架构(RTX30xx),根据 #21 的经验需要指定pytorch对应的cuda版本
#pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu117

# 安装 Poetry 依赖管理工具, 若已安装则跳过
# 参考自: https://python-poetry.org/docs/#installation
curl -sSL https://install.python-poetry.org | python3 -

# 通过poetry安装依赖
poetry install

你也可以通过pip来安装依赖

pip install -r requirements.txt

其他预模型准备

RVC需要其他一些预模型来推理和训练。

你可以从我们的Hugging Face space下载到这些模型。

以下是一份清单包括了所有RVC所需的预模型和其他文件的名称:

hubert_base.pt

./pretrained 

./uvr5_weights

想测试v2版本模型的话(v2版本模型将特征从 9层hubert+final_proj的256维输入 变更为 12层hubert的768维输入并且增加了3个周期鉴别器),需要额外下载

./pretrained_v2 

#如果你正在使用Windows则你可能需要这个文件若ffmpeg和ffprobe已安装则跳过; ubuntu/debian 用户可以通过apt install ffmpeg来安装这2个库
./ffmpeg

./ffprobe

之后使用以下指令来启动WebUI:

python infer-web.py

如果你正在使用Windows你可以直接下载并解压RVC-beta.7z,运行go-web.bat以启动WebUI。

仓库内还有一份小白简易教程.doc以供参考。

参考项目

感谢所有贡献者作出的努力