6.5 KiB
Retrieval-based-Voice-Conversion-WebUI
Retrieval Tabanlı Ses Dönüşümü Web Arayüzü
Kolay kullanılabilen VITS tabanlı bir Ses Dönüşümü çerçevesi.Değişiklik Kaydı | SSS (Sıkça Sorulan Sorular)
English | 中文简体 | 日本語 | 한국어 (韓國語) | Türkçe
Demo Videosu için buraya bakın!
RVC kullanarak Gerçek Zamanlı Ses Dönüşümü Yazılımı: w-okada/voice-changer
RVC kullanan çevrimiçi bir demo: Vocal'i Akustik Gitar sesine dönüştüren demo: https://huggingface.co/spaces/lj1995/vocal2guitar
Vocal2Guitar demo videosu: https://www.bilibili.com/video/BV19W4y1D7tT/
Ön eğitim modeli için neredeyse 50 saatlik yüksek kaliteli VCTK açık kaynaklı veri kümesi kullanılmıştır.
Lisanslı yüksek kaliteli şarkı veri kümesi, telif hakkı ihlali endişesi olmadan kullanımınız için sırayla eklenecektir.
Özet
Bu depo aşağıdaki özelliklere sahiptir:
- Top1 geri alım kullanarak kaynak özelliğini eğitim seti özelliğiyle değiştirerek ses tonu sızmasını azaltma;
- Kolay ve hızlı eğitim, hatta göreceli olarak zayıf grafik kartlarında bile;
- Az miktarda veri ile bile (en az 10 dakika düşük gürültülü konuşma tavsiye edilir) oldukça iyi sonuçlar elde etme;
- Timbrları değiştirmek için model birleştirmeyi destekleme (ckpt işleme sekmesinde ckpt birleştirme kullanma);
- Kolay kullanımlı Webui arayüzü;
- UVR5 modelini kullanarak hızlı bir şekilde vokalleri ve enstrümanları ayırma.
- En güçlü Yüksek Tiz Ses Ayıklama Algoritması InterSpeech2023-RMVPE sessiz ses sorununu önlemek için kullanılması. En iyi sonuçları (önemli ölçüde) sağlar ve Crepe_full'dan daha düşük kaynak tüketimiyle daha hızlıdır.
Ortamı Hazırlama
Aşağıdaki komutlar Python sürümü 3.8 veya daha yüksek olan ortamda çalıştırılmalıdır.
(Windows/Linux) Önce pip aracılığıyla ana bağımlılıkları yükleyin:
# PyTorch ile ilgili temel bağımlılıkları yükleyin, kuruluysa atlayın
# Referans: https://pytorch.org/get-started/locally/
pip install torch torchvision torchaudio
#Windows + Nvidia Ampere Mimarisi(RTX30xx) için, deneyime göre https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/issues/21 adresindeki cuda sürümüne göre pytorch'a karşılık gelen cuda sürümünü belirtmeniz gerekebilir
#pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu117
Sonra poetry kullanarak diğer bağımlılıkları yükleyebilirsiniz:
# Poetry bağımlılık yönetim aracını yükleyin, kuruluysa atlayın
# Referans: https://python-poetry.org/docs/#installation
curl -sSL https://install.python-poetry.org | python3 -
# Proje bağımlılıklarını yükleyin
poetry install
Bunun yerine pip kullanarak da yükleyebilirsiniz:
pip install -r requirements.txt
Mac kullanıcıları bağımlılıkları run.sh
üzerinden yükleyebilir:
sh ./run.sh
Diğer Ön-Modellerin Hazırlanması
RVC'n
in çıkarım ve eğitim için diğer ön-modellere ihtiyacı vardır.
Onları Huggingface alanımızdan indirmeniz gerekmektedir.
İşte RVC'nin ihtiyaç duyduğu Diğer Ön-Modellerin ve diğer dosyaların listesi:
./assets/hubert/hubert_base.pt
./assets/pretrained
./assets/uvr5_weights
V2 sürümü modelini test etmek istiyorsanız (v2 sürümü modeli girişi 256 boyutlu 9 katmanlı Hubert+final_proj'dan 768 boyutlu 12 katmanlı Hubert'ın özelliğine ve 3 dönem ayrımına değiştirilmiştir), ek özellikleri indirmeniz gerekecektir.
./assets/pretrained_v2
#Eğer Windows kullanıyorsanız, FFmpeg yüklü değilse bu dictionariyaya da ihtiyacınız olabilir, FFmpeg yüklüyse atlayın
ffmpeg.exe
Daha sonra bu komutu kullanarak Webui'yi başlatabilirsiniz:
python infer-web.py
Windows veya macOS kullanıyorsanız, RVC-beta.7z'yi indirip çıkarabilir ve Webui'yi başlatmak için windows'ta go-web.bat
veya macOS'te sh ./run.sh
kullanarak RVC'yi doğrudan kullanabilirsiniz.
Ayrıca, RVC hakkında bir rehber de bulunmaktadır ve ihtiyacınız varsa buna göz atabilirsiniz.
Teşekkürler
- ContentVec
- VITS
- HIFIGAN
- Gradio
- FFmpeg
- Ultimate Vocal Remover
- audio-slicer
- Vocal pitch extraction:RMVPE