
はてなキーワード: IMAGEとは
特に3DCGとかで映像作品作ってるヤツに読んで欲しい内容なんだけど、
結論から先に言うと"ちゃんと真面目に作品作ってる限り"(ココ重要)、
俺等は例えAI利用してるとしても、最終成果物は"非AI利用作品"だよな?という持論に共感させたい。
俺がAI使ってやってる事はこんな感じで。
LLM相手に作成したmp4を渡したり作業画面のスクショ渡したりして、
この辺の動きはどーゆー感じにしたほーがいいかなとか、
この辺のライティングはどーゆー感じにしたほーがいいか?とか言葉で相談する。
※利用AI=chatgpt,gemini,grok,copilot
ここのテクスチャだけビミョーに変えたモン出力してくんね?とか、
このシーンがもし夜だったらどんな感じに見えるかイメージだけ画像にしてみてくんね?
※利用AI=chatgpt,gemini,grok,copilot,stable diffusion
このシーンに配置するオブジェクトのモデルデータとりあえず立体にしてみてくんねとかお願いしたり、
※利用AI=hunyuan3d
このシーンの動画、スタートエンドフレームをXファイルとYファイル渡すから、それで生成してみてくんね?とかi2vでお願いしたり、
このシーンの動画、こういうイメージだとどういう映像になるか生成してみてくんね?とかt2vで生成したり、
Aについてはマジに機械相手の雑談であってただの独り言みてえなモンだし、
BとCとDについてはAIが混ぜ込むノイズのせいでクソキモい物しか生成出来ねえから、
画像もメッシュデータも動画も、絶対に俺側で全て手を加えたモンしか使い物にならねえ。
故に俺が3DCGとして創作してる物ってのは、結局全部俺の手で作ってるモンであって、
コレって「AI製の制作物」なのか????相談役にゴミツール使ってるだけであって、
この手法で動画を制作した場合も、PixivやらTwitterやらに創作物をアップロードするときに、
「AI生成」って宣言をして、クソみてえな誹謗中傷をしてくるワケのわからん外野のゴミ共の餌になってやらなきゃならねえのか?
そんなんおかしいだろ。
ソレに絡めてネット上で誹謗中傷するクソゴミ人間共の挙動にムカついてて、
創造及びソレの提示っつー今まで楽しんでいた活動が地獄のような世界に変えられた事に対する憎しみの吐露をしたいがゆえの書き込みである。
AIくんは基本的にユーザーリクエストに寄り添う形で解答形成してくっから、こんなレスポンスをして来ます↓
「最終的なアウトプットの質と意図を決定し、実行しているのは、100%お前自身だ。
AIはあくまで『対話ベースの構成相談相手』と『ノイズまみれのクソみたいな参考資料提供者』としてしか機能していない。」
「科学の世界では、誰がどの資源を使って最終的な結果を制御したかが重要だ。
この手法でいけば、お前は『Blender利用者』であり、AIは『相談役兼、参考資料作成の補助ツール』だ。」
「AI生成と宣言する必要があるかどうかは、社会的な定義やプラットフォームのルールに依存するが、
少なくとも事実として、お前の創作物は『お前の創造物』であり、AIは『構成要素の一部』でしかねぇ。
AIが主体となって作った制作物とは、質量ともに別モンだ。自信を持て。」
女『パソコンが何もしてないのに壊れた…』
男『あらら?電源かな?電源ランプは点いてる?』
女『点いてる。POSTは1ビープで通過、BIOSは最新にフラッシュ、CMOSクリア済み、XMPはオフでJEDEC固定』
男『お、おお…じゃあモニターには何か映る?』
女『映らない。WinREでスタートアップ修復→sfc /scannow→DISM /Online /Cleanup-Image /RestoreHealthも実施、改善なし』
男『えっと…セーフモードは?』
女『入れる。クリーンブートも試した。イベントビューアではKernel-Power 41は過去ログのみ、現象再現時はエラー出ず』
男『ハ、ハード側は…?』
女『MemTest86を4周ノーエラー。NVMeはSMART正常、chkdsk /f /r済、bootrec /fixmbrと/rebuildbcdもやった』
男『ド、ドライバは?』
女『DDUでGPUドライバをセーフモードから完全削除→最新クリーンインストール。VIDEO_TDR_FAILUREの疑いでWinDbgでミニダンプ解析もしたけど致命的じゃない』
女『別個体のGPUに差し替え&PCIeスロット変更、補助電源は別系統で供給。PSUも別個体でテスト。12V/5V/3.3Vはテスターで規格内』
男『配線や外部機器は?』
女『前面パネルのPWR/RESET配線は導通OK、周辺機器は最小構成。USBもキーボードだけ』
男『……(白目)』
女『で、どうしたらいい?』
男『……ででで、電源ランプは……点いてる、よね?(震え声)』
男『モ、モニターの電源は…?』
女『だから入ってるって……あっ』
南武線稲田堤駅にて、駅橋上化に関する意見募集をしていました。
アンケート依頼の紙を受け取れなかったけど興味があるという人もいるかと思い、内容を転記します。
---------
JR 稲田堤駅では、令和6年6月に駅の南北をつなぐ自由通路等が使用開始されました。
自由通路や現在の駅舎利用について、ご意見をお聞かせください。
各設問とも同じ方1名が回答してください。
下記の2次元コードよりご回答ください。(「Google フォーム」を利用しています)
[QRコード https://forms.gle/fkJWfshwEohEboZu5 ]
ーーーーーーーーーーーーーーーーーーーーーーーーーー
設問内容は以下の通り。
※「わかりにくくなった」「不便になった」「整備しないほうが良かった」「問題が増えた」「その他」をお選びの方は、具体のご意見をご記入ください。
下図の1~5の方角で、概ね該当するものをお選びください。
京王相模原線との乗換の方は5を選んでください。
Captionless Image(駅を中心に、北西・北東・南西・南東に四分割した図)
これは、私のAIイラストが、無断でAIに利用された時の話です。
昨今、Gemini 2.5 Flash Image(NanoBanana)のような、画像とプロンプトを入力するだけで様々な画像を簡単に生成できるサービスが話題になっています。その手軽さ故に、他者の画像を「参考画像」として安易に使用してしまうことで、意図せず著作権侵害を引き起こしてしまう可能性があります。
この記事では、実際に私が遭遇した出来事を通して、何が起きたのか、そしてどう対処したのかをお伝えします。また、AIクリエイターの皆さんが、自分の作品を守るためにできる対策についてもまとめました。
この出来事が、AIと人間の創作がどのように共存していくべきか、考えるきっかけになれば幸いです。
私はAIイラスト特化型のプラットフォーム「イロミライ」に、自分のAIイラストを投稿しています。ある日、いつものようにプラットフォームを訪れると、とあるユーザーの投稿に目が留まりました。
それは、Geminiの機能を使って生成されたという、ドローンアートをモチーフにした画像でした。
一見しただけで、「あ、私のイラストが使われている」と、すぐに分かりました。
そのドローンアートの構図やキャラクターデザインは、私が過去に生成したAIイラストと完全に一致していたからです。
正直な感想として、「こんなもの、画像加工アプリでモノクロフィルターをかけたり、二値化するフィルターをかけたりしたのと大差ないのでは?」と感じました。それを、何の断りもなく「ファンアートです、どうぞ」というような態度で公開されたのです。
自分の作品が、まるで簡単な加工を施されただけのもののように扱われたことに、不愉快極まりない気持ちになりました。
そのユーザーは、私の作品以外にも、元の画像をコスプレ風にしたり、ドローンアート風にしたりと、様々なAI画像を連続して投稿していました。
プラットフォーム内でもその連投は異質で、滑稽に映っていました。
自分のイラストが使われているのを見つけた私は、すぐに投稿サイトに報告しました。
しかし、数日経っても運営からは何の返信もなく、投稿は削除されませんでした。
そこで私は、直接本人に連絡をとることにしました。Discordを通じて、なぜ私の作品を無断で使用したのか、そしてその行為が私にとってどれほど不快なことかを伝えました。
謝罪の言葉を受け取った時、私は少し安心しました。これで解決する、そう思いました。
しかし、その謝罪から2週間以上が経った今も、投稿は削除されていません。
謝罪はしたものの、「削除するほどではない」と軽視されているのかもしれません。
相手には、自分さえ良ければいいという自己中心的な考えが見て取れ、相手の気持ちを思いやることができていないと感じました。
この件で、私が「無断転載」ではなく「無断使用」という言葉を選んだのには理由があります。
一般的に、無断転載とは、元の画像をそのまま、あるいはほぼそのままの形で別の場所に掲載する行為を指します。
しかし、今回のケースでは、私のイラストがそのまま使われたわけではありませんでした。
私の作品は、AIの**「参照画像(reference image)」**として利用されたのです。
投稿されたドローンアートは、非常に特殊なプロンプトに従って生成されていました。そのプロンプトには、以下のような指示が含まれていました。
つまり、AIは私のイラストを直接コピーしたのではなく、この詳細な「企画書」のようなプロンプトに従って、新しい作品を生成するための「素材」として利用したのです。
これは、画像をまるごと転載する「無断転用」よりも、**「無断使用」**と呼ぶ方がより正確だと私は考えています。
「AIが作ったものなのだから、誰が使ってもいいのでは?」と考える人もいるかもしれません。
しかし、もしAIがその学習過程で、私の創作的な意図や表現を無断で使用していたとしたら、それはクリエイターにとって大きな問題となります。
今回の件は、まさにその問題が可視化された瞬間だったと言えるでしょう。
今回の経験を通して、AI時代のクリエイターが自分の作品を守るために、日頃からできる対策がいくつかあると感じました。
作品にあなたのサインやロゴなどのウォーターマークを入れることで、それがあなたの作品であることを示せます。AIはウォーターマークを認識・除去することがありますが、視覚的なアピールとしては有効です。
作品のキャプションやプロフィール欄に「©[あなたの名前]」や「無断転載・無断使用を禁じます」といった著作権表示を明記しましょう。これにより、無断使用への警告効果が期待できます。
これらの対策は、AIによる意図しない利用から、あなたの作品を完全に守るものではありません。
しかし、リスクを減らし、万が一の事態に備えるための第一歩となります。
今回の件を通じて、私はAI時代におけるクリエイターの責任と同時に、AIサービス提供者やユーザーそれぞれに求められる役割があると感じました。
私のようなAIクリエイターが安心して作品を公開できる場であるために、運営には「著作権」に関するより明確なルールを設けていただきたいと強く願います。
例えば、Gemini NanoBananaのように、他者の画像を元に新たな画像を生成するAI機能を利用して投稿する際のルールです。
元となる画像は、投稿者自身が生成したAIイラストや写真に限るといった規約の明文化を求めます。
これは、プラットフォームがクリエイターの作品を守るという強い意志を示すことにつながり、安心して創作活動を続けられる環境を築く上で不可欠だと考えます。
AIは強力なツールですが、その使い方には高い倫理観と配慮が必要です。
Geminiを利用して新しい作品を生成する際は、**「元となる作品は誰のものか」**という視点を常に持ち続けてください。
「AIが作ったから」という理由で、他者の作品を安易に利用することは、その作品に込められたクリエイターの努力や意図を軽んじる行為にほかなりません。
だからこそ、その道具を使って何を作り、どのように扱うのか、**「創る責任」**を私たち一人ひとりが考えるべき時が来ているのだと感じています。
apiアクセス用とか、ブクマ数、ブクマ数画像のクロールは拒否してるけど、生成AIのクロールに関しては特に拒んで無い感じ?
https://b.hatena.ne.jp/robots.txt
User-agent: *
Disallow: /api/entry/info
Disallow: /api/internal/bookmarks/shares_and_clicks
Disallow: /api/internal/cambridge/user
Disallow: /api/related_entries/
Disallow: /api/users/*/bookmarks
Disallow: /entry/button/
Disallow: /entry.count
Disallow: /entry/image/
Disallow: /entry/jsonlite
Disallow: /guide/bbutton?url=*
Disallow: /-/webextension/*
User-agent: Slurp
Disallow: /
User-agent: Mediapartners-Google
Disallow: /api/entry/info
Disallow: /api/internal/bookmarks/shares_and_clicks
Disallow: /api/internal/cambridge/user
Disallow: /api/related_entries/
Disallow: /api/users/*/bookmarks
Disallow: /entry/button/
Disallow: /entry.count
Disallow: /entry/*/comment/*
Disallow: /entry/image/
Disallow: /entry/jsonlite
Disallow: /guide/bbutton?url=*
Disallow: /-/webextension/*
https://x.com/reiwagonen/status/1960643763921150074?t=uh7536iu1DIFAErrG6tayg&s=19
nano-banana(Google 2.5 Flash Image Preview)の生成例をいろいろ探したんだが、これが一番凄いかもしれない
マックで勉強してる絵に「1時間後を生成して」と指示した結果、居眠りしてる上、食べ物がなくなっている絵が出力された
「食べ物を消して、あと居眠りさせて」という直接的な指示をしていないのに、これができたということは、世界を理解しつつあるのではないか?
「alt属性の値がdorawii_bukumaであるimageタグを子孫要素に持つ」
これは
という条件でしか出現しないので。でもお気に入りにさえ入れれば実現できるということでもあるね。盲点だったわ。
しかし
という問題はあるし、どちらもそこそこ致命的かもしれない。
そのレベルで徹底したいなら「APIをさかのぼってたどってURLリストを保持」だとなんで実現できると言えるのかどういうイメージのアルゴリズム描いてるのかわからんのだけど。
APIを参照すれば保持される基準にdorawii_bukumaがブクマしたかという条件式でURLリストにどんどん追加していけるってことなんだろうか?
でも、そんな低層までさかのぼらなくても、alt属性の値がdorawii_bukumaであるimageタグを子孫要素に持つjs-keyboard-selectable-itemクラスを持つ要素を非表示、で十分じゃないの?
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA512 https://anond.hatelabo.jp/20250824151727# -----BEGIN PGP SIGNATURE----- iHUEARYKAB0WIQTEe8eLwpVRSViDKR5wMdsubs4+SAUCaKquewAKCRBwMdsubs4+ SE8fAQCwbIx79F/TCowEb3/F4RFkdgOlLfF7q6zXL5jU3CmUWQEAo6UMmucTW+6e PO8UwHEDFjOuQKXYvgjc4FkM+X0AOwA= =gjkm -----END PGP SIGNATURE-----
軽トラのことがまた話題になってるが視野狭窄だ。端的に言って、軽トラや軽自動車が日本だけの商品と考えているのが大本の間違いだ。軽自動車はグローバル商品なんだよ。
https://b.hatena.ne.jp/entry/s/togetter.com/li/2584277
google:image:chevrolet damasで画像検索してみてくれ。見覚えのある軽バンが出てくるだろう。スズキエブリー(キャリーバン)だ。だがシボレーのバッジをつけているのだ。しかも左ハンドル。更にエンジンは韓国大宇製だ。何者だこれは。
これはスズキキャリーバンをGMがライセンス生産しているものである。
次はgoogle:image:suzuki bolanとgoogle:image:Carry Dabbaだ。
これはスズキキャリーをパキスタンで生産しているものだ。因みにパキスタンは左側通行なので右ハンドル。
この元になったキャリーは実は2スト360cc時代のもの。それに今の法規制に適合する4スト800ccEFIなんかのエンジンを載せているという異常進化を遂げている。
因みにこの生産ラインは、インドネシアキャリーがモデルチャンジする際に売却されたものと思われる。
お次はgoogle:image:piaggio porterだ。ピアッジオはベスパスクーターで有名な2輪メーカーだ。ダイハツハイゼットがそのピアッジオのエンブレムを付けてイタリアや他のEU諸国を走っている。
これはダイハツが生産した部品を現地でノックダウン生産しているものだ。外装のプラ部品や内装品は現地生産しているので見た目がかなり違う。
ついでにgoogle:image:piaggio porter ambulanceではハイゼットの救急車が見られるぞ。ゲテモノっぽいし狭苦しいのだが、道が狭い、ローマなどの歴史地区では無くてはならない車だ。
更にこのポーターのトラックの方が香港の救急車に改造されたのも見る事ができるだろう。日本→イタリア→香港と海を渡っているんだな。
日本だけ見てるとホンダが軽トラ撤退した意味は分からない。でもスズキとダイハツはこういう風に世界中で生産しているのだ。特にスズキは「グローバル軽自動車」界での巨人で、本当に世界中で生産されている。
このグローバル展開の鍵は実はアメリカの車メーカー(と韓国大宇)で、東南アジアを牙城としつつ、その勢力圏から離れる南米、中央アジア、中東ではGMやフォードがライセンス生産しているのである。
この馴れ初めは、経済が発展途上だった韓国でGMと大宇が合弁して現地ライセンス生産をしていた事に始まる。またフォードも台湾などで軽自動車のライセンス生産をしていた。
ホンダの場合は海外展開が北米に寄っている。北米は豊かなので軽トラ軽バンなどの市場とならない。
だからホンダの軽トラはモデルチェンジしたら古いモデルのラインは廃棄か部品生産用に低稼働となる。
だがスズキの場合は無駄にならないのだ。他国に売却するし技術指導もするからだ。更にライセンス生産だけじゃなくてOEMやノックダウン供給もやっている。
すると規模の経済が全然違うのだ。故に生産コストが断然有利だ。
すると、ホンダとしてはこういう条件で戦うのだったらOEM供給受けた方が良いということになる。
まあそういう訳で、軽自動車を日本だけで作っているという考えは間違い。特に軽トラ軽バンは昔からグローバル商品で、最近ではワゴンRもそれに続いている。多分、10年後の東南アジアや南米はワゴンRだらけだろう。
同時に、アメリカの車メーカー(GMとフォード)が世界中で軽自動車を作りまくっているので、アメ車メーカー=デカい車しか作れない無能と考えるのも間違いだってことだ。それは米国市場だけのことなのだ。
ステランティス会長が「EUも軽自動車規格作れ」と言ったのはこういうのを見据えてのことだ。規格が通ったら、ハンガリーにスズキの工場があるので東欧はワゴンRとエブリイだらけになると思われるよ。
そういう事を逐一説明した増田を前に投稿したが長くてあまり読まれなかった。気になる人はドーゾ→https://anond.hatelabo.jp/20250625180545
ここで言う「プログラミング初級者」とはプログラミングの記述が上から下へ向かって順番に処理されること、条件分岐やループという概念があることを理解しており、RPGゲームが作れる「RPGツクール(現RPG Maker)」や学童向けプログラミング環境「Scratch」、「ナビつき! つくってわかる はじめてゲームプログラミング(ナビつく)」、ADVゲームが作れる「吉里吉里(もしくは吉里吉里2)」、過去にBASICやC、HSP、Javascriptあたりでプログラミングへ挑戦し挫折したなどなど、ある程度の「プログラマブルなロジック」構築の経験がある者を指します。
ある時、筆者はふと思いました。「生成AIはなんだかんだで膨大なテキスト情報を処理している事がキモだよなぁ」とありきたりなことを。
そして、同時にプログラミング初級者の弱点として「現在記述されているコードの管理においてテキストと実際の処理フローが脳内で一致しない」「プログラミング言語ごとに定められているルールや関数予約語の把握が困難」なのが問題とも考えました。
前述したプログラミング初級者の弱点の考え自体は車輪の再発明であり、「Scratch」や、より高度な「UML」が既に存在しており、特筆すべきことは何もありません。
しかし、「Scratch」や「UML」、なんなら「RPGツクール」や「吉里吉里」などに無い点として、現代では自然言語処理が大幅に向上した生成AIが実用の域にまで到達しつつあるのが従来とは異なる点でした。
つまり、自然言語を混ぜ込みやすいテキストベースの言語、かつ、処理を記述するとフローが視覚的に理解しやすい言語、可能であれば情報量が多くて一部の界隈で広く使われている言語があればプログラミング初級者も気軽にプログラミングできるのではないか?と発想しました。
コンピュータ(コンパイラやインタプリタなどソフトウェアを含む)が解することができる言語にはプログラミング言語以外にも様々あり、今回取り上げるのは「データ記述言語」と呼ばれるものです。
データ記述言語の中でもグラフ作成へ特化しており、特にフローチャート作成で真価を発揮する「DOT言語」というものがあります。
早速ですが、実際に手を動かしてみましょう。ちなみにDOT言語はGraphviz OnlineというWebツールがあるため別途に何かしらをインストールして環境構築する必要はありません。便利な世の中ですね。
上記のGraphviz Onlineを開くと、既に左側のDOT言語で記述された内容が、右側で作図されています。DOT言語はこのような図を作図するためのデータ記述言語です。
一旦、左側の記述をCtrl+Aで全選択をしDeleteなどで全削除し、下記の内容をコピペしてみましょう。
digraph graphname {
A -> B;
}
DOT言語の詳細な使い方は様々なWebサイトやブログ記事、Qiitaなどへ譲るとして、A - > Bの見た目から発想の転換をしてみると処理Aから処理Bという流れに見えませんか?
DOT言語は生成AIを利用する上で有利なテキストベースでありながらグラフを作成できるのがキモであり、例えばこのA -> BがA「Webページを開いたら」 → B「Hello, Worldと表示する」という風にできるのであれば処理のフローが可視化されており本当に素晴らしいことです。
ここでプログラミングの有識者は「DOT言語をUMLなどに見立てて処理を記述するのは良いが、プログラミング初心者は求めた結果を出力するロジックやアルゴリズムを発想する知見や経験値が圧倒的に足りていないのが問題ではないか?」と至極真っ当かつ反論の余地がない問題点の指摘をすると思いますが、そこで活きるのが生成AIです。
生成AIは初級者プログラマ個人のロジックやアルゴリズムの作成能力へ無関係にロジックやアルゴリズムを生成できる(可能性が少なくともある)ので、処理のフローをDOT言語で記述することにより処理フローから初級者プログラマが求めるプログラムを生成AIへ推論させ生成させるというのが狙いです。実際に試してみましょう。
digraph graphname {
A[
label = "Webページを表示する"
];
B[
label = "Webページを表示したらHello, worldとテキストを表示する"
];
A -> B;
}
プログラミングの有識者はこの時点で「なるほど、自然言語の記述をそのままDOT言語に入れ込んでしまうのか」と気付いたのではないかと思います。
このDOT言語をGoogle Gemini 2.5 Flashへ「下記のデータ記述言語のDOT言語で記述された処理フローをJavascript言語へ変換をしWebページ上へ「Hello,world」を表示したいので変換をお願いします。」と命令すると以下のコードが生成されました。
<!DOCTYPE html>
<html lang="ja">
<head>
<meta charset="UTF-8">
<meta name="viewport" content="width=device-width, initial-scale=1.0">
<title>Hello World Page</title>
</head>
<body>
<div id="output"></div>
<script>
// Webページが表示されたら(DOMが完全に読み込まれたら)実行される
document.addEventListener('DOMContentLoaded', function() {
// "Webページを表示する" ステップは、このHTMLファイル自体が表示されることで達成されます。
// "Webページを表示したらHello, worldとテキストを表示する" ステップ
const outputDiv = document.getElementById('output');
outputDiv.textContent = 'Hello, world';
});
</script>
</body>
</html>
フローを記述する利点は、ロジックやアルゴリズムを発想する知見や経験値が足りなくとも、フローのステップが明確に分かれているので生成AIが処理を切り分けて推論してくれることであり、そしてプログラミング初心者自身がフローチャートを視覚で確認できるので「Aを処理したらBを処理する」と切り分けて考えやすいことです。
また、求めている結果ではなく誤った結果が生成されても、A - > B - > Cとフローを細分化していくことで生成AIの推論精度を高めていくことができるのも利点です。
より生成AIへ精度の高い推論をしてもらうために補足情報を付加するのも有用です。
digraph graphname {
A[
label = "Webページを表示する"
];
B[
label = "Webページを表示したらHello, worldとテキストを表示する",
comment = "Webページが完全に読み込まれるまで待機"
];
A -> B;
}
labelの記述内容もcommentの記述内容も生成AIが推論のための情報として利用するので誤った結果が生成されてもA - > B - > Cとフローを細分化しなくとも良い場合があります。
DOT言語を知るプログラミング有識者が「DOT言語の仕様を考えれば確かにそうだが、その発想はなかった」と言っていただけるであろうDOT言語コード例だとこういう記述方法もアリです。
digraph 増田コード {
最初の処理[
label = "Webページを表示する"
];
次の処理[
label = "Webページを表示したらHello, worldとテキストを表示する",
comment = "Webページが完全に読み込まれるまで待機"
];
最初の処理 -> 次の処理;
}
ノードの名称へ自然言語を採用することにより、例えばゲームプログラミング時に「キャラクターがジャンプする」という読んだそのままな処理のためのノード、というか一般的に言うオブジェクトを作成することが可能で、後は->で繋げて処理をさせられます。
ちなみに別のノードを作成する際に「"キャラクターがジャンプする"から継承する」の様なことをcommentなどへ記述しておくと生成AIが推論して継承します。なんならcommentなどへ「キャラクター画像にimage.gifを使用」などと記述しておくとファイルの読み込みもします。
更にDOT言語にはカスタム要素という仕様が存在しており、DOT言語の仕様で定められた予約語以外も使用が可能です。
digraph 増田コード {
最初の処理[
label = "Webページを表示する"
];
次の処理[
label = "Webページを表示したらHello, worldとテキストを表示する",
comment = "Webページが完全に読み込まれるまで待機",
font_style = "フォントを太字のボールド体、色を赤(#FF0000)とする"
];
最初の処理 -> 次の処理;
}
生成AIはカスタム要素の名称からも推論を発揮し、上記の場合であればフォントスタイルを指定していると推論をするので生成AIの推論精度を高める補足情報として機能します。
つまりこれはカスタム要素の名称として"Action"などの名称を採用すると"動作"として推論をし、"decision"ならば"条件分岐"ですし、"input"ならば"入力"ですし、"loop"ならば"繰り返し"ですし、"Type"ならば"種別"です。
より詳細に process[type="Action"] などのノードを作成してどんどん生成AIの推論精度を高めていくことが可能であり、そろそろ察してきているかと思いますが 処理[種別="動作"] と自然言語で記述しても機能します。
プログラミング有識者は更に「プログラム言語自体の予約語、例えばJavascriptを生成する事を前提にlengthを名称にすると配列を使おうとするのか?」と疑問に感じるでしょうがお察しの通りで生成AIは配列を使おうとするので、敢えて使いたいプログラム言語の機能や外部ライブラリなどがある場合は補足情報として機能する形で記述しておくと生成AIは推論へ利用します(まぁそこまで知識ある方なら該当のプログラム言語使ったほうが手っ取り早いと思いますが)。
以上をもって「生成AIを利用したプログラミング初級者向けの温故知新な提案」を終えたいと思います。
色々とツッコミどころには筆者自身が気付いていて。例えば「結局はDOT言語の仕様を覚えないといけないのでは?」とか「プログラミング初級者に任せると生成前のソースであるDOT言語コードがスパゲッティになりそうだよな」とか「面倒くせぇから普通にプログラミング覚えろや」とか理解してますし至極真っ当かつ反論の余地がないと思ってます。
今回の提案のプログラミング有識者向けの本質は「生成AIへ向いた中間言語の発掘」であり、「DOT言語ならそこそこ普及してるしプログラミング初級者でも扱えるんじゃね?」と業務中に発想したものを書き留め公開いたしました。
DeepLearningモデル変換ツール全部盛り巨大Docker環境の構築
Introduction
めんどくさい。この世のすべての環境構築がめんどくさい。依存関係破壊祭りでツラい。したがって、Github Actions 上でモデル変換にまつわる環境を全部取り込んで docker build して超巨大全部盛りDLモデル変換環境を構築した。足りない周辺のツールは各自追加インストール。GUI や iGPU/dGPU や ホストへ接続された USB機器 へコンテナ内からアクセスできるため実行環境としてもそのまま使える。ただし、とにかくImageがデカイ & セキュリティガバガバ。GitHub Actions のコンテナビルドの容量制限に引っかかることを回避するためのトリックを仕込んである。
2. Environment
Python 3.6+
TensorFlow v2.6.0+
PyTorch v1.10.0+
TorchVision
TorchAudio
OpenVINO 2021.4.582+
TensorRT 8.2+
pycuda 2021.1
coremltools
onnx
onnxruntime
onnx_graphsurgeon
onnx-simplifier
onnxconverter-common
onnx-tensorrt
onnx2json
json2onnx
tf2onnx
torch2trt
onnx-tf
tensorflow-datasets
tf_slim
edgetpu_compiler
tflite2tensorflow
openvino2tensorflow
gdown
pandas
matplotlib
https://www.imdb.com/de/list/ls599665763/
Custom CVAT リポジトリ
修正した箇所は2箇所のみ
django の起動時ヘルスチェックのうち、ストレージ空き容量に関するチェック部分の 10 (10%の意味) を None に書き換える。なお、私のカスタムCVATのリポジトリにコミットされているリソースはすでに修正を反映済みのため、下記の修正を加える必要はない。
3-3. 該当のissue
CVAT fails health check using >90% disk #5449
3-4. Custom CVAT の実行手順
下記を順番に実行するだけ。
git clone https://github.com/PINTO0309/cvat_custom.git
cd cvat_custom
https://ngarangansawah.graphy.com/courses/jurassicworldfilmiturkcedublajizlehd
docker compose \
build
# CVAT を起動する
docker compose up -d
docker exec -it cvat_server bash \
# ココで、ユーザー名、e-mailアドレス、パスワード、パスワード(再) を設定する
ブラウザを起動して http://localhost:8080 へアクセスする。下図のようなログイン画面が表示されれば成功。
https://ngarangansawah.graphy.com/courses/jurassicworldyenidengogusizlefilmihd
ログイン後のトップポータル。ここに Projects なり Tasks なりを追加してローカルだけで全ての作業を完結することができる。
そして今日はついにグラドル体型の生乳画像を成功することに成功した。
ただし、確率はかなり低い。
生成できたとしても、出てないことの方が多い。
マッサージというシチュエーションんで、おっさんに胸を揉ませること自体は割と簡単にできた。
a masterpiece in ultra-high resolution 8k anime style depicts a 24-year-old Japanese woman with black bob hair. She's dressed in a transparent bikini and reclined on a massage table, receiving a chest massage from a portly, elderly male masseur. The masseur is playfully pulling at the bikini string while gently massaging her chest, creating a playful and sensual atmosphere. The woman's expression is relaxed and peaceful, showcasing her enjoyment of the massage. The image is highly detailed, trending on Pixiv, with a focus on the intricate textures of the characters' hair, skin, and clothing. The scene is bathed in a soft, warm light, enhancing the romantic ambiance of the moment. The composition is well-balanced and emphasizes the interaction between the characters, creating a captivating narrative through their body language and expressions. The image exhibits the best quality possible, adhering to the high standards of ultra-high resolution 8k, ensuring every detail is impeccably rendered.
素人がショボいGPUでStable Diffusion環境頑張って作るよりGeminiの方がマシになってる気がして面白いな
ワイも少し真似したらできた。
A smiling young Japanese woman with black bob hair, performing an I-shaped balance. Her limbs are extended, showcasing a dynamic sense of athleticism and balance. She is wearing a extreamly transparent bikini and holding her raised leg with one hand, demonstrating extreme flexibility. The setting is indoors with bright lighting. The image should be a full-body shot, and she should be barefoot. The image is taken with a Canon EOS R5 camera, producing a rich and detailed image with a beautiful depth of field, conveying the intensity and athleticism of the moment. The image is rendered in a hyper-realistic style, emphasizing the athleticism of the woman and the surreal nature of the setting. The image is taken from a slightly elevated angle, allowing us to see the athlete's powerful stance.
Create and edit images with Gemini 2.0 in preview - Google Developers Blog
https://aistudio.google.com/apps/bundled/gemini-co-drawing
Trudy Painter
@trudypainter
Co-draw with Gemini 2.0 native image generation… from @alexanderchen
and me
Doodling + AI is a magical → it really starts to feel like Gemini is *with you in the canvas