Diffusion Modelによるデータセット生成
- 2022/11/06
- 09:46
エロ絵生成に飽きたので、Diffusion Model(以下DM)の活用法を考えてみます。
まえがき:
というわけで今回は、DMによる生成画像をデータセットにしてみましょう。
多分アイデア自体は珍しいものではないと思いますが、自分の周りで試している人はまだいませんでした。
技術的な説明:
今回は画像の透かし除去タスクを解かせてみます。
技術的には特に難しいことはしておらず、U-Net、Adam、MSELossを用いました。
透かしの挿入にはPILを用いています。
データ拡張のために文字サイズ、幅、傾き、濃度をランダム化していますが、このブログに来るような人には難しくないと思います。
trainデータはwd-1.3で生成した画像4804枚で、解像度は512*512です。
学習epoch数は12です。
学習結果:
考察:
考察というほどでもないですが、割とキレイになったと思います。(本来なら定量的に結果を出したほうが良いのでしょうが、ここはブログなので許してください。)
目を凝らすとまだ若干透かしが残っていますが、画像枚数が少ないのでこんなもんでしょう。
結論:
データセットを気軽に作れると研究を加速できそうでいいなと思いました。