Retrieval-based-Voice-Conve.../Changelog_CN.md

### 20230513更新
功能更新：
- 清除一键包内部老版本runtime内残留的infer_pack和uvr5_pack
- 修复训练集预处理伪多进程的bug
- 增加harvest识别音高可选通过中值滤波削弱哑音现象，可调整中值滤波半径
- 导出音频增加后处理重采样
- 训练n_cpu进程数从"仅调整f0提取"改为"调整数据预处理和f0提取"
- 自动检测logs文件夹下的index路径，提供下拉列表功能
- tab页增加"常见问题解答"（也可参考github-rvc-wiki）

待完成：
- 推理音量预处理归一化
- 推理后处理音量包络融合输入音频的音量包络
- 增加选项:每次epoch保存的小模型均进行提取

RVC很快会陆续更新v2版的新底模（先发40k采样率的，32k和48k的仍在训练中）！大幅改善呼吸、清辅音（唇齿音）的电音和撕裂伪影，请期待！

### 20230409更新
- 修正训练参数，提升显卡平均利用率，A100最高从25%提升至90%左右，V100:50%->90%左右，2060S:60%->85%左右，P40:25%->95%左右，训练速度显著提升
- 修正参数：总batch_size改为每张卡的batch_size
- 修正total_epoch：最大限制100解锁至1000；默认10提升至默认20
- 修复ckpt提取识别是否带音高错误导致推理异常的问题
- 修复分布式训练每个rank都保存一次ckpt的问题
- 特征提取进行nan特征过滤
- 修复静音输入输出随机辅音or噪声的问题（老版模型需要重做训练集重训）

### 20230416更新
- 新增本地实时变声迷你GUI，双击go-realtime-gui.bat启动
- 训练推理均对<50Hz的频段进行滤波过滤
- 训练推理音高提取pyworld最低音高从默认80下降至50,50-80hz间的男声低音不会哑
- WebUI支持根据系统区域变更语言（现支持en_US，ja_JP，zh_CN，zh_HK，zh_SG，zh_TW，不支持的默认en_US）
- 修正部分显卡识别（例如V100-16G识别失败，P4识别失败）

### 20230428更新
- 升级faiss索引设置，速度更快，质量更高
- 取消total_npy依赖，后续分享模型不再需要填写total_npy
- 解锁16系限制。4G显存GPU给到4G的推理设置。
- 修复部分音频格式下UVR5人声伴奏分离的bug
- 实时变声迷你gui增加对非40k与不懈怠音高模型的支持

### 后续计划：
功能：
- 增加选项:每次epoch保存的小模型均进行提取
- 增加选项:推理额外导出mp3至填写的路径（批量推理）
- 支持多人训练选项卡（至多4人）

底模：
- 收集呼吸wav加入训练集修正呼吸变声电音的问题
- 我们正在训练增加了歌声训练集的底模，未来会公开
- 升级鉴别器（尝试MRD）
- 升级自监督特征结构
-												Update Changelog_CN.md
											
										
										
											2023-05-13 03:41:06 +08:00
+								### 20230513更新
 								功能更新：
 								- 清除一键包内部老版本runtime内残留的infer_pack和uvr5_pack
 								- 修复训练集预处理伪多进程的bug
 								- 增加harvest识别音高可选通过中值滤波削弱哑音现象，可调整中值滤波半径
 								- 导出音频增加后处理重采样
 								- 训练n_cpu进程数从"仅调整f0提取"改为"调整数据预处理和f0提取"
 								- 自动检测logs文件夹下的index路径，提供下拉列表功能
 								- tab页增加"常见问题解答"（也可参考github-rvc-wiki）
 								待完成：
 								- 推理音量预处理归一化
 								- 推理后处理音量包络融合输入音频的音量包络
 								- 增加选项:每次epoch保存的小模型均进行提取
 								RVC很快会陆续更新v2版的新底模（先发40k采样率的，32k和48k的仍在训练中）！大幅改善呼吸、清辅音（唇齿音）的电音和撕裂伪影，请期待！
 								### 20230409更新
-												优化 change log 格式 (#86)

* 优化 change log 格式

* Apply Code Formatter Change

---------

Co-authored-by: fumiama <fumiama@users.noreply.github.com>
											
										
										
											2023-04-17 20:49:54 +08:00
+								- 修正训练参数，提升显卡平均利用率，A100最高从25%提升至90%左右，V100:50%->90%左右，2060S:60%->85%左右，P40:25%->95%左右，训练速度显著提升
 								- 修正参数：总batch_size改为每张卡的batch_size
 								- 修正total_epoch：最大限制100解锁至1000；默认10提升至默认20
 								- 修复ckpt提取识别是否带音高错误导致推理异常的问题
 								- 修复分布式训练每个rank都保存一次ckpt的问题
 								- 特征提取进行nan特征过滤
 								- 修复静音输入输出随机辅音or噪声的问题（老版模型需要重做训练集重训）
 								### 20230416更新
 								- 新增本地实时变声迷你GUI，双击go-realtime-gui.bat启动
 								- 训练推理均对<50Hz的频段进行滤波过滤
 								- 训练推理音高提取pyworld最低音高从默认80下降至50,50-80hz间的男声低音不会哑
 								- WebUI支持根据系统区域变更语言（现支持en_US，ja_JP，zh_CN，zh_HK，zh_SG，zh_TW，不支持的默认en_US）
 								- 修正部分显卡识别（例如V100-16G识别失败，P4识别失败）
-												Update Changelog_CN.md
											
										
										
											2023-04-28 00:09:12 +08:00
+								### 20230428更新
 								- 升级faiss索引设置，速度更快，质量更高
 								- 取消total_npy依赖，后续分享模型不再需要填写total_npy
 								- 解锁16系限制。4G显存GPU给到4G的推理设置。
 								- 修复部分音频格式下UVR5人声伴奏分离的bug
 								- 实时变声迷你gui增加对非40k与不懈怠音高模型的支持
-												优化 change log 格式 (#86)

* 优化 change log 格式

* Apply Code Formatter Change

---------

Co-authored-by: fumiama <fumiama@users.noreply.github.com>
											
										
										
											2023-04-17 20:49:54 +08:00
+								### 后续计划：
-												Update Changelog_CN.md
											
										
										
											2023-04-28 00:09:12 +08:00
+								功能：
 								- 增加选项:每次epoch保存的小模型均进行提取
-												Update Changelog_CN.md
											
										
										
											2023-05-13 03:41:06 +08:00
+								- 增加选项:推理额外导出mp3至填写的路径（批量推理）
-												Update Changelog_CN.md
											
										
										
											2023-04-28 00:30:45 +08:00
+								- 支持多人训练选项卡（至多4人）
-												Update Changelog_CN.md
											
										
										
											2023-05-13 03:41:06 +08:00
-												Update Changelog_CN.md
											
										
										
											2023-04-28 00:09:12 +08:00
+								底模：
-												优化 change log 格式 (#86)

* 优化 change log 格式

* Apply Code Formatter Change

---------

Co-authored-by: fumiama <fumiama@users.noreply.github.com>
											
										
										
											2023-04-17 20:49:54 +08:00
+								- 收集呼吸wav加入训练集修正呼吸变声电音的问题
 								- 我们正在训练增加了歌声训练集的底模，未来会公开
-												Update Changelog_CN.md
											
										
										
											2023-05-13 03:41:06 +08:00
+								- 升级鉴别器（尝试MRD）
-												Update Changelog_CN.md
											
										
										
											2023-04-28 00:09:12 +08:00
+								- 升级自监督特征结构