Retrieval-based-Voice-Conve.../Changelog_CN.md

20230409

&emsp;1-修正训练参数，提升显卡平均利用率，A100最高从25%提升至90%左右，V100:50%->90%左右，2060S:60%->85%左右，P40:25%->95%左右，训练速度显著提升

&emsp;2-修正参数：总batch_size改为每张卡的batch_size

&emsp;3-修正total_epoch：最大限制100解锁至1000；默认10提升至默认20

&emsp;4-修复ckpt提取识别是否带音高错误导致推理异常的问题

&emsp;5-修复分布式训练每个rank都保存一次ckpt的问题

&emsp;6-特征提取进行nan特征过滤

&emsp;7-修复静音输入输出随机辅音or噪声的问题（老版模型需要重做训练集重训）

20230416更新

&emsp;1-新增本地实时变声迷你GUI，双击go-realtime-gui.bat启动
  
&emsp;2-训练推理均对<50Hz的频段进行滤波过滤
  
&emsp;3-训练推理音高提取pyworld最低音高从默认80下降至50,50-80hz间的男声低音不会哑
  
&emsp;4-WebUI支持根据系统区域变更语言（现支持en_US，ja_JP，zh_CN，zh_HK，zh_SG，zh_TW，不支持的默认en_US）
  
&emsp;5-修正部分显卡识别（例如V100-16G识别失败，P4识别失败）

后续计划：

&emsp;1-收集呼吸wav加入训练集修正呼吸变声电音的问题

&emsp;2-研究更优的默认faiss索引配置，计划将索引打包进weights/xxx.pth中，取消推理界面的 特征/检索库 选择

&emsp;3-根据显存情况和显卡架构自动给到最优配置（batch size，训练集切块，推理音频长度相关的config，训练是否fp16），未来所有>=4G显存的>=pascal架构的显卡都可以训练或推理，而<4G显存的显卡不会进行支持

&emsp;4-我们正在训练增加了歌声训练集的底模，未来会公开

&emsp;5-推理音高识别选项加入"是否开启中值滤波"

&emsp;6-增加选项:每次epoch保存的小模型均进行提取; 增加选项:设置默认测试集音频，每次保存的小模型均在保存后对其进行推理导出，用户可试听（来选择哪个中间epoch最好）
-												Create Changelog_CN.md
											
										
										
											2023-04-09 23:31:06 +08:00
+								20230409
-												Update Changelog_CN.md
											
										
										
											2023-04-16 17:56:31 +08:00
+								&emsp;1-修正训练参数，提升显卡平均利用率，A100最高从25%提升至90%左右，V100:50%->90%左右，2060S:60%->85%左右，P40:25%->95%左右，训练速度显著提升
-												Create Changelog_CN.md
											
										
										
											2023-04-09 23:31:06 +08:00
-												Update Changelog_CN.md
											
										
										
											2023-04-16 17:56:31 +08:00
+								&emsp;2-修正参数：总batch_size改为每张卡的batch_size
-												Create Changelog_CN.md
											
										
										
											2023-04-09 23:31:06 +08:00
-												Update Changelog_CN.md
											
										
										
											2023-04-16 17:56:31 +08:00
+								&emsp;3-修正total_epoch：最大限制100解锁至1000；默认10提升至默认20
-												Create Changelog_CN.md
											
										
										
											2023-04-09 23:31:06 +08:00
-												Update Changelog_CN.md
											
										
										
											2023-04-16 17:56:31 +08:00
+								&emsp;4-修复ckpt提取识别是否带音高错误导致推理异常的问题
-												Create Changelog_CN.md
											
										
										
											2023-04-09 23:31:06 +08:00
-												Update Changelog_CN.md
											
										
										
											2023-04-16 17:56:31 +08:00
+								&emsp;5-修复分布式训练每个rank都保存一次ckpt的问题
-												Create Changelog_CN.md
											
										
										
											2023-04-09 23:31:06 +08:00
-												Update Changelog_CN.md
											
										
										
											2023-04-16 17:56:31 +08:00
+								&emsp;6-特征提取进行nan特征过滤
-												Update Changelog_CN.md
											
										
										
											2023-04-09 23:57:14 +08:00
-												Update Changelog_CN.md
											
										
										
											2023-04-16 17:56:31 +08:00
+								&emsp;7-修复静音输入输出随机辅音or噪声的问题（老版模型需要重做训练集重训）
 								20230416更新
 								&emsp;1-新增本地实时变声迷你GUI，双击go-realtime-gui.bat启动
 								&emsp;2-训练推理均对<50Hz的频段进行滤波过滤
 								&emsp;3-训练推理音高提取pyworld最低音高从默认80下降至50,50-80hz间的男声低音不会哑
 								&emsp;4-WebUI支持根据系统区域变更语言（现支持en_US，ja_JP，zh_CN，zh_HK，zh_SG，zh_TW，不支持的默认en_US）
 								&emsp;5-修正部分显卡识别（例如V100-16G识别失败，P4识别失败）
 								后续计划：
 								&emsp;1-收集呼吸wav加入训练集修正呼吸变声电音的问题
 								&emsp;2-研究更优的默认faiss索引配置，计划将索引打包进weights/xxx.pth中，取消推理界面的 特征/检索库 选择
 								&emsp;3-根据显存情况和显卡架构自动给到最优配置（batch size，训练集切块，推理音频长度相关的config，训练是否fp16），未来所有>=4G显存的>=pascal架构的显卡都可以训练或推理，而<4G显存的显卡不会进行支持
 								&emsp;4-我们正在训练增加了歌声训练集的底模，未来会公开
 								&emsp;5-推理音高识别选项加入"是否开启中值滤波"
-												Update Changelog_CN.md
											
										
										
											2023-04-16 18:43:53 +08:00
 								&emsp;6-增加选项:每次epoch保存的小模型均进行提取; 增加选项:设置默认测试集音频，每次保存的小模型均在保存后对其进行推理导出，用户可试听（来选择哪个中间epoch最好）