こんなツイートをしますた。 ということでDDSPを推していきます(?) DDSP-SVCとは 👆これです。 Real-time end-to-end singing voice conversion system based on DDSP (Differentiable Digital Signal Processing). らしいです。 RVC並みの学習速度でかつ品質はRVCより上(多分)っていうやつです。 さらにリアルタイム音声変換ではRVCよりもレイテンシが低いらしい。 拡散モデルと組み合わせればさらに質がよくなるようです。 なんか面白そうですよね。 ということで触っていきましょう。 インストール