見出し画像

【動画生成AI】EasyWanVideoを使ってみる【Wan2.1】

動画生成AIのhow to記事です。
今回はZuntanさんがリリースしたEasyWanVideoを紹介します。

✅メンバーシップの紹介
当メンバーシップは、最新のAI技術や情報を取り入れ、マネタイズや業務効率化につなげることが目的です。
インターネット上には膨大な情報がありますが、必要な情報を見つけて実行するには多くの時間と労力がかかります。
また、それらの情報が数万円で販売されていることも少なくありません。
その調査の手間を省き、厳選した情報を低価格で提供しています。
なお、私自身専門的な知識があるわけではないため、一緒に成長していけたらというスタンスです。
メンバーシップ(月額500円)に加入すると、一部の有料記事が読み放題です。最新のAI技術を素早くキャッチし、実践したい方はぜひご検討ください。

EasyWanVideoとは?

先日リリースされた動画生成モデルWan2.1を簡単に動かせるツールです。
バッチファイルを実行するだけで簡単に環境構築できるのが特徴。

特にComfyUIはAttentionやtriton周りの環境構築を自分でやろうとすると結構大変だったりします。
知らない状態だと調べるところから始める必要があり、こういうのを知らなくても動かせるというのは魅力的です。
kijai氏のワークフローだとRAMの要件が64GBと少し高いですが、Native版も用意してくれているのでそちらは32GBでも動きます。
VRAMはRTX 3060 12GBで問題ないとのこと。
また容量は最低限のインストールで約14GB、I2V用のバッチファイルを実行すると約30GBくらいになります。

EasyWanVideoのインストール

github見れば書いてあるので分かる方はこちらを見てください。
https://github.com/Zuntan03/EasyWanVideo

この記事では実際に試した自分なりの解説をしてます。

まず以下のリンクから「EasyWanVideoInstaller.bat」を右クリックして保存します。
https://github.com/Zuntan03/EasyWanVideo?tab=readme-ov-file#%E3%82%A4%E3%83%B3%E3%82%B9%E3%83%88%E3%83%BC%E3%83%AB

CやD直下にEasyWanなどのフォルダを作り、その中にダウンロードしたバッチファイルを移動して実行してください。

C:\EasyWan\EasyWanVideoInstaller.bat

そうすると確認画面が出るのでyを入力して進めます。

画面が消えたらインストール完了です。

SageAttentionのインストール

SageAttentionのセットアップをすることで生成時間が約半分になるそうです。

作成したEasyWanフォルダからEasyWanVideo→SageAttentionに行くと「SetupSageAttention.bat」があるのでそれを実行します。

C:\EasyWan\EasyWanVideo\SageAttention\SetupSageAttention.bat

フォルダ内に以下2つのファイルができるので、実行します。

  • vs_buildtools.exe

  • cuda_12.8.0_windows_network.exe

vs_buildtools.exe

こちらを実行すると以下のような画面が開きます。
C++ によるデスクトップ開発を選択して右下のインストールをクリックしてください。

cuda_12.8.0_windows_network.exe

こちらは特に選択する画面などはありません。そのまま手順に沿って進めてインストールしてください。

モデルのダウンロード

モデルのダウンロードにはCvitaiのAPI keyが必要です。
まずアカウント登録していない方は事前に登録してください。

ログインすると右上にアカウントのアイコンが表示されるので、クリックして設定画面を開きます。

ページ下部にAPI Keysという項目があるので、Add API Keyをクリックします。

任意の名前を付けてSaveしてください。

そうするとAPI Keyが表示されるのでこれをメモっておきます。

ローカルに戻って、Downloadフォルダにあるkijai版とNative版のバッチファイルを実行します。
t2v・i2v・Allなど用途に合わせて分かれているので、自分が使いたいものを実行してください。
スペックが足りているならkijai版の方が良いと思います。

C:\EasyWan\Download

実行するとターミナルが開くので、ここに先ほどのAPI Keyを入力してEnterを押すとダウンロードが始まります。

一度実行するとAPI Keyはローカルに保存されるようなので、再度入力する必要はありません。

少し時間がかかりますが、これが終わったら実行可能です。

EasyWanVideoの起動&実行

作成したフォルダ内にあるComfyUi.batを実行するとComfyUIを起動できます。

左側のフォルダアイコンから使用したいワークフローを選択してください。

私のスペックだとkijai版がOOMになってしまうのでNative_I2V480pで試してみます。

ノードの設定

モデルなどは指定されているようなので、自分で操作するのは画像、LoRA、プロンプト、動画のサイズや長さくらいだと思います。

画像のセット

動かしたい画像をセットします。

プロンプト

どう動かしたいかをプロンプトで指定します。

SageAttension

高速化できるSageAttensionを使いたい場合はONにすれば使えるみたいです。

WanImageToVideo

動画の長さ・サイズはここで変えられます。

Nativeはここまで設定したらあとは実行すると動画生成が始まります。

LoRAを使う(kijai版

※アップデートでNative版もLoRAを選択できるようになりました。

Kijai版も上記の設定までは同じですが、別途LoRAを使うことができます。

LoRA の有効・無効でオンにしたノードのLoRAが指定できるようになるので、使いたいLoRAを選択します。

隣にある「右クリック View LoRA Info で 情報表示(生成に影響無し)」というところで使用するLoRAを選び、右クリックから「View Lora info」をクリックします。

そうするとそのLoRAのトリガーワードなどが表示されるので、これらをプロンプトに入力するとLoRAを反映できます。
※ないものもあります。

Native版はImpactWildcardEncodeというノードでLoRAを選択できるようになっています。

自動モザイクやその他設定(Kijai版)

処理の有効・無効を切り替えで自動orマスクでモザイク処理、MP4保存、画像からプロンプトなどを有効にできます。

ON/OFFを切り替えで対象のノードが有効化されるので、もし自分で設定をいじりたい人はそこで調整してください。
例)マスクでモザイク処理をONにするとこのエリアが有効化され、自分で指定できます。

私の環境だとkijai版はOOMで動かせないのですが、おそらくLoRAやモザイクはこの辺りで設定できると思います。

Native版を実行するとこんな動画ができました。(約25分)
サイズ変えるの忘れて横長にしちゃったせい?かわかりませんが、元画像とは顔が別人になってしまいました。

他のワークフロー

他のワークフローでモザイク、アップスケール、フレーム補間が行えます。
最初と同じようにフォルダから使用するワークフローを選んでください。

モザイク処理

これはWebpに対して自動or手動でモザイクをかけられるワークフローです。

モザイク処理の切り替えで自動・手動を切り替えられます。

まず自動の場合は、「モザイクをかける動画の webp を開く」でWebpを取り込みます。

SEGM Detector (SEGS)でモザイクをかけたい部分を入力します。
直接的な表現が含まれるため、指定方法については隣にあるnoteのノードを確認してください。

これで実行すると対象の部分に対してモザイクがかかったものが出力されます。

手動の場合は、「画像を読み込み、右クリックから Open in Mask Editor で編集」と書かれたノードにwebpを取り込みます。

右クリックからOpen in Mask Editorを選択します。

そうするとマスクをかけられる画面が開くので、モザイクをかけたい部分にマスクをかけます。

画面上部にあるsaveを押して実行するとoutputにモザイクがかかったwebpが出力されます。

アップスケール

アップスケールはそのまま画像の解像度を拡大できるものです。

こちらもまずwebpを取り込みます。

使用するモデルを選択します。

画像を拡大(指定サイズ)で拡大方法と倍率を指定します。

あとは実行すればアップスケールされた動画が出力されます。
2倍にしたものと比較してみました。
上が通常、下がアップスケールしたもの。
アップスケールしても大きな破綻などはなく、気持ち描写がクリアになっている印象です。

フレーム補間

フレーム補間は簡単に言えば動画をヌルヌルにできるものです。

パラメータの意味があまり分からなかったのでWebpを取り込んでデフォルトのまま実行しました。

上が通常、下がフレーム補間処理したもの。
髪の毛とかわりとはっきり違いが出ているような気がします。

基本の使い方は以上です。

感想

本当に環境構築が簡単っていうのが一番のメリットだと思います。
モデル探したり、分かんない所は調べたりという手間が一切かからないので、そういう部分を短縮したい方にはおすすめです。
Native版もLoRAのノードを追加すれば普通に使えるので、必要最低限の環境を簡単にセットアップしたいという方はぜひ試してみてください。

ただkijai版がスペック不足で使えない、ComfyUIを自分で導入できる方なら自分で頑張った方が良いかも知れません。
単純に容量が節約できるのと、Native版でLoRAを使うなら結局自分で組み込む必要があるからです

※LoRAはアップデートでワークフローに追加されました。

あくまでwan2.1の環境構築やノードが簡単に使えるツールというものだと思うので、他の用途でもComfyUIを使うシーンがある場合は、自分で頑張った方が後々便利かなと感じました。

ただワークフローの組み方とか参考になりますし、動画生成以外のワークフローも使えるシーンは多いので、一度使ってみるのはありだと思います。

以上EasyWanVideoの使い方をご紹介しました。

当サークルではこのようなAIに関するさまざまな情報を発信しています。
メンバーシップに加入して頂くと一部の有料記事は読み放題です。
AI技術の向上、マネタイズ方法などに興味がある方は、ぜひご検討ください。

もしこの記事が少しでも役に立った場合は、いいねやフォローして頂けると励みになります。
最後まで読んでいただき、ありがとうございました。

いいなと思ったら応援しよう!

aiaicreate よろしければサポートお願いします! いただいたサポートはクリエイターとしての活動費に使わせていただきます!