文字で画像を生成できるMidjourney(ミッドジャーニー)が、5度目のアップデートを実施し、最新バージョンV5アルファ版をリリースしました。
Midjourney V5では、まるで実在するかのような、リアルな仕上がりや質感が話題となっています。「指や歯などがうまく描写できない問題」も、解決されているようです。
Midjourney V5を実際に使うことで分かった、押さえておきたい新機能や注目ポイントを、備忘録メモ的にまとめています。
Midjourney 5はサブスクユーザー限定の先行リリース
Midjourney V5を利用できるのは、現在サブスクユーザーのみ。有料プランの特典として、プロンプトをまとめた雑誌を無料で一冊プレゼント中。クーポンコード「SUBSCRIBER」と入力すれば、$4がタダに。
Midjourney 5の使い方
最新バージョンV5を使う方法は2通り。ひとつはプロントの最後に、–v 5と直接入力し、画像生成を行う方法。もうひとつが以下のコマンドを入力し、現在の設定を確認、変更する方法。
「バージョンを4に戻したい」、そんなときにもおすすめ。
/settings
ミッドジャーニーの使い方ガイドで紹介した、ボットとのダイレクトメッセージ対話による画像生成とは他に、便利な使い方がもうひとつ。
サブスクユーザー限定となりますが、自分のDiscordサーバーを作成し、Midjourney botを招待することもできます。これなら用途別にチャンネルを振り分け、利用することが可能。
Midjourneyのプロンプトに関するよくある質問は、Discordサーバーチャンネル「#prompt-faq」にまとめられています。
Midjourney V5アップデートについて
今回のアップデートで変更された仕様のなかで、注目ポイントをいくつかピックアップしています。すでに次のアップデートも言及されており、V6は2ヶ月後にリリース予定となっています。
すべての画像が高画質で生成される
ミッドジャーニーで生成する画像が、すべて高解像度になりました。これまで1分ほどかかっていた画像拡大Upscaleも、ボタンを押すと同時に完了です。
よりリアルな画像が表現できるように
多すぎる指や歯なども、最新バージョンでは限りなく正確に生成できるようになりました。
このアップデートでもっと変化した点として、肌の質感がリアルなほど忠実に再現できるのも特長でしょう。
プロンプトの文字入力にも変化
自然言語処理(Natural Language Processing)が改善したことで、生成したい画像に関連するキーワードを、「,(カンマ)」で区切って生成していた、これまでのプロンプトの書き方では、残念な結果になってしまうことも。
学校で習うような英文、英作文を意識してプロンプトを入力するようにしましょう。
Hummer H1 standing dirty in the jungle, moisture and haze in the air, professional vibrant grading, soft shadows, no contrast, clean sharp, focus, commercial photography --ar 6:4 --v 5
前バージョンも利用可能
ミッドジャーニーのバージョン5では、これまでと同じプロンプトでもスタイルが変わってきます。用途や好みによっては、「バージョン4のスタイルが表現したい」というときもあるでしょう。入力するプロンプトの最後に、–v 4を追加することで、旧バージョンをいつでも利用できます。
ディテールを詳しく表現するプロンプトが必要に
バージョン4までは「8K」や「Unreal Engine」などを、プロンプトに追加することで、よりリアルな質感を表現していました。しかしバージョン5では、「Cinematic Lighting(映画のような照明)」といった、より詳しい描写が必要になります。
自由なアスペクト比が利用可能に
これまでは生成する画像の縦横比に制限がありましたが、バージョン5からは自由になりました。これによって「1:3」など、ポスターのような魅力的な構図にも対応できます。
「1:10」といった、細長い線のようなレイアウトを試しているユーザーも。インフォグラフィクスの作成などにはいいかも。
継ぎ目のないパターンが作成できるように
ミッドジャーニー最新版では、継ぎ目のないパターンが作成できるようになりました。プロンプトの最後に、–tileを入力するだけで、シームレスな画像が生成できる、覚えておきたいコマンドのひとつ。
a colorful galaxy tiled with stars, planets, and spaceships --tile --v 5
意味不明な文字はまだあります
ミッドジャーニーでの画像生成の精度は上がっていますが、生成される文字テキストにはまだまだ改善の余地がありそうです。表示される文字列はでたらめですし、日本語テキストにもまだ未対応なので、これからのアップデートが楽しみ。
絵文字もいけます
プロンプトに絵文字を入力するだけで、画像生成もできます。以下は、「🌈🏟」と入力した場合。
以下は同じプロンプトを、バージョン4で生成した場合。好みはありますが、バージョン5は本物の写真のようなリアルさが、これまでとは全く異なります。
Midjourney 5 x ChatGPT-4の合わせ技
ユーザーの中には、こちらも先日アップデートされたばかりのGPT-4で、Midjourneyのプロンプトを考え、画像を自動生成するという合わせ技も披露する人も。GPT-4にまず、Midjourneyの仕組みを学習させることで、プロ写真家が撮影したようなプロンプトを実現しています。
Midjourney利用ガイドをまるっとコピーし、GPT-4に読み込ませることで、プロンプトの生成方法を学習させます。実際に試してみたところ、「美味しそうなパスタ」というテーマで生成された画像がこちら。
まるでプロのカメラマンが撮影したような、AIが自動で生成したとは思えないほどのクオリティー。これまでコストがかかっていた料理の写真も、だれでも手軽に作成できる時代がくるかもしれません。
GPT-4が生成したプロンプトを使った画像をもう一枚。「1930年代の女性インフルエンサー(1930’s Female Influencer)」をテーマに。
GPT-4にMidjourneyについて適切に学習させることで、時代背景にもあったクラシックカーを前に、美しい女性がポーズをとる姿が生成されました。
最後は「バレリーナ」という、シンプルなキーワードで生成されたプロンプトを利用したケース。照明の当たり方などにも注目です。
現在Midjourney V5はテスト段階で、サブスクユーザーのみが利用可能となっています。
Midjourney関連の最新情報は、Discordサーバーで公開されています。
Midjourneyのキホンの使い方はこちら。
Midjourney(ミッドジャーニー)で思い通りに画像生成できる徹底ガイド
Midjourneyのウェブ制作での活用術もまとめています。
Midjourney x ChatGPTでWebページ作成も試してみました。