mirror of
https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI.git
synced 2024-12-29 19:15:04 +08:00
优化 change log 格式 (#86)
* 优化 change log 格式 * Apply Code Formatter Change --------- Co-authored-by: fumiama <fumiama@users.noreply.github.com>
This commit is contained in:
parent
88a43e14d1
commit
35379217e8
@ -1,42 +1,23 @@
|
|||||||
20230409
|
### 20230409
|
||||||
|
- 修正训练参数,提升显卡平均利用率,A100最高从25%提升至90%左右,V100:50%->90%左右,2060S:60%->85%左右,P40:25%->95%左右,训练速度显著提升
|
||||||
|
- 修正参数:总batch_size改为每张卡的batch_size
|
||||||
|
- 修正total_epoch:最大限制100解锁至1000;默认10提升至默认20
|
||||||
|
- 修复ckpt提取识别是否带音高错误导致推理异常的问题
|
||||||
|
- 修复分布式训练每个rank都保存一次ckpt的问题
|
||||||
|
- 特征提取进行nan特征过滤
|
||||||
|
- 修复静音输入输出随机辅音or噪声的问题(老版模型需要重做训练集重训)
|
||||||
|
|
||||||
 1-修正训练参数,提升显卡平均利用率,A100最高从25%提升至90%左右,V100:50%->90%左右,2060S:60%->85%左右,P40:25%->95%左右,训练速度显著提升
|
### 20230416更新
|
||||||
|
- 新增本地实时变声迷你GUI,双击go-realtime-gui.bat启动
|
||||||
 2-修正参数:总batch_size改为每张卡的batch_size
|
- 训练推理均对<50Hz的频段进行滤波过滤
|
||||||
|
- 训练推理音高提取pyworld最低音高从默认80下降至50,50-80hz间的男声低音不会哑
|
||||||
 3-修正total_epoch:最大限制100解锁至1000;默认10提升至默认20
|
- WebUI支持根据系统区域变更语言(现支持en_US,ja_JP,zh_CN,zh_HK,zh_SG,zh_TW,不支持的默认en_US)
|
||||||
|
- 修正部分显卡识别(例如V100-16G识别失败,P4识别失败)
|
||||||
 4-修复ckpt提取识别是否带音高错误导致推理异常的问题
|
|
||||||
|
|
||||||
 5-修复分布式训练每个rank都保存一次ckpt的问题
|
|
||||||
|
|
||||||
 6-特征提取进行nan特征过滤
|
|
||||||
|
|
||||||
 7-修复静音输入输出随机辅音or噪声的问题(老版模型需要重做训练集重训)
|
|
||||||
|
|
||||||
20230416更新
|
|
||||||
|
|
||||||
 1-新增本地实时变声迷你GUI,双击go-realtime-gui.bat启动
|
|
||||||
|
|
||||||
 2-训练推理均对<50Hz的频段进行滤波过滤
|
|
||||||
|
|
||||||
 3-训练推理音高提取pyworld最低音高从默认80下降至50,50-80hz间的男声低音不会哑
|
|
||||||
|
|
||||||
 4-WebUI支持根据系统区域变更语言(现支持en_US,ja_JP,zh_CN,zh_HK,zh_SG,zh_TW,不支持的默认en_US)
|
|
||||||
|
|
||||||
 5-修正部分显卡识别(例如V100-16G识别失败,P4识别失败)
|
|
||||||
|
|
||||||
后续计划:
|
|
||||||
|
|
||||||
 1-收集呼吸wav加入训练集修正呼吸变声电音的问题
|
|
||||||
|
|
||||||
 2-研究更优的默认faiss索引配置,计划将索引打包进weights/xxx.pth中,取消推理界面的 特征/检索库 选择
|
|
||||||
|
|
||||||
 3-根据显存情况和显卡架构自动给到最优配置(batch size,训练集切块,推理音频长度相关的config,训练是否fp16),未来所有>=4G显存的>=pascal架构的显卡都可以训练或推理,而<4G显存的显卡不会进行支持
|
|
||||||
|
|
||||||
 4-我们正在训练增加了歌声训练集的底模,未来会公开
|
|
||||||
|
|
||||||
 5-推理音高识别选项加入"是否开启中值滤波"
|
|
||||||
|
|
||||||
 6-增加选项:每次epoch保存的小模型均进行提取; 增加选项:设置默认测试集音频,每次保存的小模型均在保存后对其进行推理导出,用户可试听(来选择哪个中间epoch最好)
|
|
||||||
|
|
||||||
|
### 后续计划:
|
||||||
|
- 收集呼吸wav加入训练集修正呼吸变声电音的问题
|
||||||
|
- 研究更优的默认faiss索引配置,计划将索引打包进weights/xxx.pth中,取消推理界面的 特征/检索库 选择
|
||||||
|
- 根据显存情况和显卡架构自动给到最优配置(batch size,训练集切块,推理音频长度相关的config,训练是否fp16),未来所有>=4G显存的>=pascal架构的显卡都可以训练或推理,而<4G显存的显卡不会进行支持
|
||||||
|
- 我们正在训练增加了歌声训练集的底模,未来会公开
|
||||||
|
- 推理音高识别选项加入"是否开启中值滤波"
|
||||||
|
- 增加选项:每次epoch保存的小模型均进行提取; 增加选项:设置默认测试集音频,每次保存的小模型均在保存后对其进行推理导出,用户可试听(来选择哪个中间epoch最好)
|
||||||
|
Loading…
Reference in New Issue
Block a user