記事一覧

RTX4090でDiff-SVCを学習するメモ

歌声合成のDiff-SVCが流行っていたのでローカルで動かそうとしたのでうが、若干ハマったので備忘として残しておきます。
データセットを生成する際、nvSTFT.pyのget_melで用いられているtorch.stftがCUFFT_INTERNAL_ERRORというエラーを吐く現象がありました。

私の環境はこんな感じです。
GPU: RTX4090
OS: Ubuntu 22.04
CUDA: 11.8
torch: 1.13.1
python: 3.8.15

同様の現象はnvidiaのフォーラムpytorchのissueでも報告されています。詳細はそちらを見てください。
librosaという別のライブラリで置き換えて動くようにしたので、同様の症状を抱えている人のために残しておきます。
nvSTFT.pyのget_melを下のように書き換えてください。

Screenshot from 2023-01-24 21-25-29
(2023/01/24 21:30 ソースコードが間違っていたため訂正しました。)

音声のことはよく分からないのですが、学習結果を見る限りちゃんと動いてるっぽいので大丈夫だと思います。

Screenshot from 2023-01-24 18-12-10

私は音声の専門家ではないので分からないのですが、stftやrfftでいちいちエラー吐かれたらたまんないですね。

ではまた。

コメント

コメントの投稿

非公開コメント

検索フォーム

プロフィール

birdMan

Author:birdMan
作ったもの(特に有志作成のmodや翻訳ファイル)を検索に引っかかるように置いてます.あとノウハウの共有備忘が目的です.

注意:
本ブログではアフィリエイトは一切使用していません.
何か連絡があったら下にSteamのプロフィールへのリンクを載せているのでそこへお願いします.