Merge pull request #23 from Nowebyone/main

Create RVC改进意见.txt
This commit is contained in:
liujing04 2023-04-09 19:03:26 +08:00 committed by GitHub
commit d8803e1678
No known key found for this signature in database
GPG Key ID: 4AEE18F83AFDEB23
1 changed files with 36 additions and 0 deletions

36
RVC改进意见.txt Normal file
View File

@ -0,0 +1,36 @@
ToDo
停车按钮
根据每E时间推测训练剩余时间
记录点Demo:
推理时可以选择哪些记录点然后批量自动推理出demo以便对比节点过拟合和欠拟合情况
训练时可以自动推理每个保存节点的Demo便于实时听过拟合和欠拟合[可单独选择一张推理用卡]
训练队列:
可以队列训练列表,训练结束后自动进行下一个训练
配置文件保存:
WebUI的预设可以保存为配置文件下次启动时自动读取
推理自动选择特征库检索文件
Epoch和保存频率、Batch size等可以从滑条改为一个纵向的输入数字的配置面板
WebUI可以重新布局 详情参考目录下的WebUI_参考(目前尚未建立)
模型推理可以做成单次拖拽类的
个人的小想法:
可以试着接入一些类似于Vocaloid的工程文件来读取F0音高曲线
比如SV,ACE,Vocaloid,Cevio Studio这种歌声合成软件
然后再给到f0编辑器(如果有了)
能暴露接口然后可以用QT做个桌面程序毕竟QT也是跨平台的
可以给到一个端口让他们在云端跑本地跑这个QT程序桌面程序来控制云端的训练和推理
IsDo: