記事一覧

Diffusion Modelによるデータセット生成

エロ絵生成に飽きたので、Diffusion Model(以下DM)の活用法を考えてみます。

まえがき:

というわけで今回は、DMによる生成画像をデータセットにしてみましょう。
多分アイデア自体は珍しいものではないと思いますが、自分の周りで試している人はまだいませんでした。

技術的な説明:

今回は画像の透かし除去タスクを解かせてみます。
技術的には特に難しいことはしておらず、U-Net、Adam、MSELossを用いました。
透かしの挿入にはPILを用いています。
データ拡張のために文字サイズ、幅、傾き、濃度をランダム化していますが、このブログに来るような人には難しくないと思います。
trainデータはwd-1.3で生成した画像4804枚で、解像度は512*512です。
学習epoch数は12です。

学習結果:
名称未設定

考察:

考察というほどでもないですが、割とキレイになったと思います。(本来なら定量的に結果を出したほうが良いのでしょうが、ここはブログなので許してください。)
目を凝らすとまだ若干透かしが残っていますが、画像枚数が少ないのでこんなもんでしょう。

結論:

データセットを気軽に作れると研究を加速できそうでいいなと思いました。

コメント

コメントの投稿

非公開コメント

検索フォーム

プロフィール

birdMan

Author:birdMan
作ったもの(特に有志作成のmodや翻訳ファイル)を検索に引っかかるように置いてます.あとノウハウの共有備忘が目的です.

注意:
本ブログではアフィリエイトは一切使用していません.
何か連絡があったら下にSteamのプロフィールへのリンクを載せているのでそこへお願いします.