サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
今年の「#文学」
programmingforever.hatenablog.com
キャラの固定 一貫性のあるキャラクタを出そうとした場合は、例えば初音ミクなどの有名なキャラクタを指定すれば作成されるキャラが安定する。 初音ミクを指定して生成した例 これに対して自分好みのキャラに固定して、色々と絵を生成しようとした場合、以下のような要素をプロンプトで固める必要がある。 年齢(省略可能) 身長(省略可能) 髪の色(固定のためには指定が望ましい) 目の色(省略可能) 胸のサイズ(省略可能、小さめなど) 細身・太めなど(省略可能) 服(上半身、下半身、靴:固定のためには指定が望ましい) 作風や作家名、描画スタイル(固定のためには指定が望ましい) 例えば「赤いTシャツとダメージジーンズを着たブロンドのショートボブの18歳の女性、胸は小さい」というプロンプト「18-year-old woman with short blonde bob in a red T-shirt and d
colab ノートAkaibu1.3対応 簡単かつエラーが出なくなった新しいcolabノートが利用出来るので、そちらをベースに記事を書き直した。またモデルやVAEファイルなどを動的に切り替え可能とすべく、正規の場所に配置する内容に改訂した。 想定する読者 Google colabでAUTOMATIC1111を使いたい 起動時間を速くしたい モデルのダウンロード量や時間を削減したい Waifu DiffusionやTrinart Diffusionなど色々なモデルを使いたい 複数のモデルやVAEなどを動的に切り替えたい 注意点 Google colab proまたはpro+の利用を推奨。5GBを超えるモデルの場合、colab無料版ではメモリ不足によるエラーが発生する場合がある Google Driveの容量確保。それぞれモデルの容量は3~7GB程度あるため保存領域が必要 NSFWフィルターが
1枚の絵だけで学習するDreamArtist 複数枚の絵で学習させるDreamBoothに対して1枚の絵だけで学習できるDreamArtistが登場した。AUTOMATIC1111で使えるとのことなので早速Google colabで試してみた。 DreamArtistとは 必要なファイルをDL出来るサイトは以下の通り。 github.com DreamArtistは、1つのトレーニング画像でコンテンツとスタイルを学習し、制御性の高い多様な高品質の画像を生成します。 DreamArtist の埋め込みは、追加の説明や 2 つの学習した埋め込みと簡単に組み合わせることができます。 イメージ図。元画像のキャラが再現できている。 DreamArtistの例 Texture Inversion, DreamBooth,との比較(いずれも学習は1枚のみ) 3方式の比較 Imagicとの違い 同様に1枚
AI画像生成プロンプトの探索 AI画像生成プロンプトは世界中で研究されている。 最初にプロンプトの概要を簡単にまとめる。こちらの概要はMidJourney,Stable Diffusion(DreamStudio),DALLE-2などのAI画像生成ツールで使える。 次にプロンプトの情報が閲覧できる優れたサイトを複数紹介する。 AI画像生成の手順 画像生成のプロンプトはどの様に打ち込んでいるだろうか。思いつくまま単語だけを入力しても生成されるが、狙ったイメージに近づけるにはお作法が求められる。 理想的な生成パターン 生成したい画像のイメージをまとめる 定形に従ってプロンプト(日本語)を書く(得意な方は英語で) 翻訳サイトでプロンプトを英文に変更(Google翻訳など活用) AI画像生成サイトにプロンプトを投入 繰り返し生成、あるいはプロンプトを修正して生成 納得のいく画像が生成されたら保存や
Google colabで生成 Google colabとは Google colabは、Google社が機械学習の教育や研究用で提供する、インストール不要でPythonや機械学習・深層学習の環境をすぐに構築出来る無料のサービス。CPU及びGPU(1回12時間)の環境が利用可能。基本的に無料で使えるが、高速なGPUが使える有料サービスもある。 Google colabでAI画像生成 MidJourneyなどAI画像生成を使うにはwebサービスを使うのが一般的だ。それに対してStable Diffusion は研究成果一式をオープンにして誰でも自由にローカルPCあるいはクラウド上で画像生成が行える様にした。これを受けて爆発的に世界中で研究や開発が加速している。 但しローカル環境で画像生成する場合はそれなりのGPUとメモリを積んだPCで無ければ実行は難しい。2022年現在で理想的なPCを構築し
NovelAIDiffusionの編集画面 NovelAIDiffusionの画面右側には画像調整に使える色々なパラメータが揃っている。そこで各パラメーターを調整することで絵がどの様に変化するか実証してみた。 実証①:Add Quality Tags 本日サービスがアップデートされ、リッチなイメージで生成する「masterpiece, best quality, 」をプロンプトの先頭に付与するAdd Quality Tagsボタンが追加された。 デフォルトの画像生成の品質を向上させるために、Add Quality Tags(画質タグを追加)の設定を有効/無効にできるボタンを追加しました。有効にされた場合、再度設定を無効にしない限り、すべてのプロンプトのテキストの先頭に「masterpiece, best quality, 」が自動的に追加されます。 pic.twitter.com/jnhd
人形を使ってポーズ指定 絵や人形を使った画像生成 NovelAIDiffusionは、生成される絵に対して絵や写真で指示を与える「img2img」(image to imageの略語)の機能も搭載している。img2imgに絵を与える主な方法は3つある。 ①既存の絵を与える ②手書きで絵を与える ③3Dモデルでポーズを与える img2imgは絵の一部修正の目的でも利用する。 それでは最初に3つの絵を与える方法を説明し、次にimg2imgの重要なパラメータであるstrengthとnoizeが与える影響、最後に絵の一部を修正する目的で行うimg2img(インペインティング)のやり方を説明する。 ①既存の絵を与える メジャーな「イラストや」の絵を使ってみる。 盾を持つ女性のイラストと階段を降りる女性のイラストをそれぞれ絵の入力とし、初音ミクをプロンプトで与えた。一番左が「イラストや」の元の絵で、右
NovelAIでお約束の魔法のプロンプトcute cat ear maid NoveiAIのAI画像サービスが始まる 本日(米国10/2)にNovelAIのtxt2imgサービスが開始されたので早速使ってみた。ログイン先は以下の通り。 novelai.net NovelAIDiffusion NovelAIはMidJourney等と同じ様に有料会員制のサービスだ。元々小説の自動生成サービスを先行していたが、この度AI画像生成に進出した。Stable Diffusionをオリジナルとしつつも独自のアルゴリズムを実装したものを、NovelAIDiffusionの名称でサービスを行うことを宣言されている。 We decided to release #NovelAIDiffusion models as standalone releases: NovelAI Diffusion Anime (
述べたいこと Gitのcommit履歴を移動するコマンドとしてgit checkoutとgit resetがあるが、どの記事を見てもgit 3大ツリーとの関わり(挙動)を細かく記載したものがなかったため作成した(下記の別記事)。この記事では初心者向けにgit checkoutとgit resetの基本的な違いに関して述べる。 programmingforever.hatenablog.com コマンド機能表 git checkoutとgit resetコマンド実行後に変更される、HEAD(commit履歴内の位置)、staging(ステージング or index)、作業ディレクトリ(Working directory)の一覧表を記載する。詳細はこの後に各図で説明するが、この表で理解出来る方は上で記載した別記事を推奨する(本記事は初心者向け)。 誰を対象にした記事か Git初心者 失敗した時
このページを最初にブックマークしてみませんか?
『programmingforever.hatenablog.com』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く