Retrieval-based-Voice-Conve.../Changelog_CN.md

36 lines
1.7 KiB
Markdown
Raw Normal View History

### 20230409
- 修正训练参数提升显卡平均利用率A100最高从25%提升至90%左右V100:50%->90%左右2060S:60%->85%左右P40:25%->95%左右,训练速度显著提升
- 修正参数总batch_size改为每张卡的batch_size
- 修正total_epoch最大限制100解锁至1000默认10提升至默认20
- 修复ckpt提取识别是否带音高错误导致推理异常的问题
- 修复分布式训练每个rank都保存一次ckpt的问题
- 特征提取进行nan特征过滤
- 修复静音输入输出随机辅音or噪声的问题老版模型需要重做训练集重训
### 20230416更新
- 新增本地实时变声迷你GUI双击go-realtime-gui.bat启动
- 训练推理均对<50Hz的频段进行滤波过滤
- 训练推理音高提取pyworld最低音高从默认80下降至50,50-80hz间的男声低音不会哑
- WebUI支持根据系统区域变更语言现支持en_USja_JPzh_CNzh_HKzh_SGzh_TW不支持的默认en_US
- 修正部分显卡识别例如V100-16G识别失败P4识别失败
2023-04-28 00:09:12 +08:00
### 20230428更新
- 升级faiss索引设置速度更快质量更高
- 取消total_npy依赖后续分享模型不再需要填写total_npy
- 解锁16系限制。4G显存GPU给到4G的推理设置。
- 修复部分音频格式下UVR5人声伴奏分离的bug
- 实时变声迷你gui增加对非40k与不懈怠音高模型的支持
### 后续计划:
2023-04-28 00:09:12 +08:00
功能:
- 增加选项:每次epoch保存的小模型均进行提取
- 增加选项:推理额外导出mp3至填写的路径
2023-04-28 00:30:45 +08:00
- 支持多人训练选项卡至多4人
-
2023-04-28 00:09:12 +08:00
底模:
- 收集呼吸wav加入训练集修正呼吸变声电音的问题
- 我们正在训练增加了歌声训练集的底模,未来会公开
2023-04-28 00:09:12 +08:00
- 升级鉴别器
- 升级自监督特征结构