RTX4090でDiff-SVCを学習するメモ
- 2023/01/24
- 18:24
歌声合成のDiff-SVCが流行っていたのでローカルで動かそうとしたのでうが、若干ハマったので備忘として残しておきます。
データセットを生成する際、nvSTFT.pyのget_melで用いられているtorch.stftがCUFFT_INTERNAL_ERRORというエラーを吐く現象がありました。
私の環境はこんな感じです。
GPU: RTX4090
OS: Ubuntu 22.04
CUDA: 11.8
torch: 1.13.1
python: 3.8.15
同様の現象はnvidiaのフォーラムやpytorchのissueでも報告されています。詳細はそちらを見てください。
librosaという別のライブラリで置き換えて動くようにしたので、同様の症状を抱えている人のために残しておきます。
nvSTFT.pyのget_melを下のように書き換えてください。
(2023/01/24 21:30 ソースコードが間違っていたため訂正しました。)
音声のことはよく分からないのですが、学習結果を見る限りちゃんと動いてるっぽいので大丈夫だと思います。
私は音声の専門家ではないので分からないのですが、stftやrfftでいちいちエラー吐かれたらたまんないですね。
ではまた。