### 20230513更新 功能更新: - 清除一键包内部老版本runtime内残留的infer_pack和uvr5_pack - 修复训练集预处理伪多进程的bug - 增加harvest识别音高可选通过中值滤波削弱哑音现象,可调整中值滤波半径 - 导出音频增加后处理重采样 - 训练n_cpu进程数从"仅调整f0提取"改为"调整数据预处理和f0提取" - 自动检测logs文件夹下的index路径,提供下拉列表功能 - tab页增加"常见问题解答"(也可参考github-rvc-wiki) 待完成: - 推理音量预处理归一化 - 推理后处理音量包络融合输入音频的音量包络 - 增加选项:每次epoch保存的小模型均进行提取 RVC很快会陆续更新v2版的新底模(先发40k采样率的,32k和48k的仍在训练中)!大幅改善呼吸、清辅音(唇齿音)的电音和撕裂伪影,请期待! ### 20230409更新 - 修正训练参数,提升显卡平均利用率,A100最高从25%提升至90%左右,V100:50%->90%左右,2060S:60%->85%左右,P40:25%->95%左右,训练速度显著提升 - 修正参数:总batch_size改为每张卡的batch_size - 修正total_epoch:最大限制100解锁至1000;默认10提升至默认20 - 修复ckpt提取识别是否带音高错误导致推理异常的问题 - 修复分布式训练每个rank都保存一次ckpt的问题 - 特征提取进行nan特征过滤 - 修复静音输入输出随机辅音or噪声的问题(老版模型需要重做训练集重训) ### 20230416更新 - 新增本地实时变声迷你GUI,双击go-realtime-gui.bat启动 - 训练推理均对<50Hz的频段进行滤波过滤 - 训练推理音高提取pyworld最低音高从默认80下降至50,50-80hz间的男声低音不会哑 - WebUI支持根据系统区域变更语言(现支持en_US,ja_JP,zh_CN,zh_HK,zh_SG,zh_TW,不支持的默认en_US) - 修正部分显卡识别(例如V100-16G识别失败,P4识别失败) ### 20230428更新 - 升级faiss索引设置,速度更快,质量更高 - 取消total_npy依赖,后续分享模型不再需要填写total_npy - 解锁16系限制。4G显存GPU给到4G的推理设置。 - 修复部分音频格式下UVR5人声伴奏分离的bug - 实时变声迷你gui增加对非40k与不懈怠音高模型的支持 ### 后续计划: 功能: - 增加选项:每次epoch保存的小模型均进行提取 - 增加选项:推理额外导出mp3至填写的路径(批量推理) - 支持多人训练选项卡(至多4人) 底模: - 收集呼吸wav加入训练集修正呼吸变声电音的问题 - 我们正在训练增加了歌声训练集的底模,未来会公开 - 升级鉴别器(尝试MRD) - 升级自监督特征结构