Skip to content

AI-Hobbyist/wav2project_tiny

Repository files navigation

歌声转工程

基于 MSST 和 Wav2Svp 修改,可一键分离伴奏及人声,并根据人声生成工程,工程支持 svp、ustx、ust、vsqx、acep,该版本为精简版,只保留了所需部分代码。

使用方法

  1. 安装PyTorch
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
  1. 安装依赖
pip install -r requirements.txt
  1. 命令行推理
python wav2project.py 歌声路径 输出路径 -t 曲速 -s 启用步骤 -f 格式(可选的其他工程格式:ust, ustx, vsqx, acep)
  1. webui推理
python webui.py

关于启用步骤

可选值: vocal_separation, harmony_removal, deverb, denoise

注意事项: 每步要用英文逗号 , 分隔。

MSST用到的模型

注意事项:

  1. 请将所需权重下载到 models/msst 目录下

人声分离: model_bs_roformer_ep_368_sdr_12.9628 (点击下载

去除和声: model_mel_band_roformer_karaoke_aufr33_viperx_sdr_10.1956(点击下载

去除混响: deverb_bs_roformer_8_256dim_8depth(点击下载

去除噪声: denoise_mel_band_roformer_aufr33_aggr_sdr_27.9768(点击下载

Wav2Svp用到的模型

注意事项

  1. rmvpe 模型下载到 models/rmpve
  2. some 模型下载到 models/some

midi提取: model_steps_64000_simplified (点击下载

f0提取: rmvpe (点击下载

参考项目

MSST-WebUI: https://github.com/SUC-DriverOld/MSST-WebUI

Wav2Svp:https://github.com/SUC-DriverOld/wav2svp

LibreSVIP:https://github.com/SoulMelody/LibreSVIP