Retrieval-based-Voice-Conve.../README.ja.md

5.4 KiB
Raw Blame History

Retrieval-based-Voice-Conversion-WebUI

使いやすいVITSベースの音声変換(ボイスチェンジャー)フレームワーク

madewithlove


Open In Colab Licence Huggingface


ChangeLog

English | 中文简体 | 日本語

デモ映像はこちらからご覧いただけます

RVCによるリアルタイム音声変換: w-okada/voice-changer

はじめに

本リポジトリには以下の特徴がある:

  • top1検索を利用して、ソース特徴量をトレーニングセット特徴量に置き換えることで、トーンリークを低減する;
  • 比較的貧弱なグラフィックカードでも、簡単かつ高速にトレーニングできる;
  • 少量のデータで比較的良好な結果が得られる(10分以上の低イズ音声を推奨);
  • 音色を変えるためのモデルマージをサポート(ckpt processingタブ->ckpt mergeを使用);
  • 使いやすいWebuiインターフェース;
  • ボーカルと楽器を素早く分割するために、UVR5モデルを使用することができます。
  • 事前学習モデルのデータセットには、約50時間に及ぶ高品質なVCTKオープンソースデータセットが使用されており、著作権侵害を心配することなく使用できるよう、高品質なライセンス楽曲データセットが次々とトレーニングセットに追加されます。

環境構築

poetryで依存関係をインストールすることをお勧めします。

以下のコマンドは、Python3.8以上の環境下で実行する必要があります:

# PyTorch関連の依存関係をインストール。インストール済の場合はスキップ
# 参照先: https://pytorch.org/get-started/locally/
pip install torch torchvision torchaudio

#Windows Nvidia Ampere Architecture(RTX30xx)の場合、https://github.com/liujing04/Retrieval-based-Voice-Conversion-WebUI/issues/21 のissueに従い、pytorchに対応するcudaバージョンを指定する必要があります。

pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu117

# PyTorch関連の依存関係をインストール。インストール済の場合はスキップ
# 参照先: https://python-poetry.org/docs/#installation
curl -sSL https://install.python-poetry.org | python3 -

# Poetry経由で依存関係をインストール
poetry install

pipでも依存関係のインストールが可能です:

注意:faiss 1.7.2macOSSegmentation Fault: 11が発生するので、requirements.txtの該当行を faiss-cpu==1.7.0に変更してください。

pip install -r requirements.txt

その他モデル前の準備

RVCは推論と訓練のために、他の多くのPre Trained Modelを必要とします。

これらのモデルはHugging Face spaceから取得することが可能です。

以下は、RVCに必要なPre Trained Modelやその他のファイルの一覧です。

hubert_base.pt

./pretrained 

./uvr5_weights

# ffmpegがすでにインストールされている場合はスキップ。
./ffmpeg

その後、以下のコマンドでWebuiを起動

python infer-web.py

Windowsをお使いの方は、直接RVC-beta.7zをダウンロードして解凍してRVCを使い、go-web.batを実行してWebUIを起動することができます。

WebUIの英語版は2週間ほどで公開する予定です。

また、リポジトリに小白简易教程.docがありますので、参考にしてください。

参考資料等

コントリビュータの皆様の尽力に感謝します