Retrieval-based-Voice-Conve.../RVC改进意见.txt
2023-04-09 19:52:29 +09:00

36 lines
1.2 KiB
Plaintext
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

ToDo
停车按钮
根据每E时间推测训练剩余时间
记录点Demo:
推理时可以选择哪些记录点然后批量自动推理出demo以便对比节点过拟合和欠拟合情况
训练时可以自动推理每个保存节点的Demo便于实时听过拟合和欠拟合[可单独选择一张推理用卡]
训练队列:
可以队列训练列表,训练结束后自动进行下一个训练
配置文件保存:
WebUI的预设可以保存为配置文件下次启动时自动读取
推理自动选择特征库检索文件
Epoch和保存频率、Batch size等可以从滑条改为一个纵向的输入数字的配置面板
WebUI可以重新布局 详情参考目录下的WebUI_参考(目前尚未建立)
模型推理可以做成单次拖拽类的
个人的小想法:
可以试着接入一些类似于Vocaloid的工程文件来读取F0音高曲线
比如SV,ACE,Vocaloid,Cevio Studio这种歌声合成软件
然后再给到f0编辑器(如果有了)
能暴露接口然后可以用QT做个桌面程序毕竟QT也是跨平台的
可以给到一个端口让他们在云端跑本地跑这个QT程序桌面程序来控制云端的训练和推理
IsDo: