turn this photo into a character figure. Behind it, place a box with the character's image printed on it, and a computer showing the Blender modeling process on its screen. In front of the box, add a round plastic base with the character figure standing on it. set the scene indoors if possible

Permalink | 記事への反応(0) | 01:24

2025-10-02

■JR 南武線 稲田堤駅 自由通路の意見募集中　（締め切り　10月24日）

南武線稲田堤駅にて、駅橋上化に関する意見募集をしていました。

アンケート依頼の紙を受け取れなかったけど興味があるという人もいるかと思い、内容を転記します。

－－－－－－－－－

JR 稲田堤駅 自由通路等整備に関するアンケート 調査

JR 稲田堤駅では、令和6年6月に駅の南北をつなぐ自由通路等が使用開始されました。

自由通路や現在の駅舎利用について、ご意見をお聞かせください。

ご協力よろしくお願いいたします。

注）設問は問1〜問12まであります。

各設問とも同じ方１名が回答してください。

回答は、統計的に処理し個人が特定されることはございません。

下記の2次元コードよりご回答ください。(「Google フォーム」を利用しています)

[QRコード　 https://forms.gle/fkJWfshwEohEboZu5　]

回答期限：令和7年 10月24日(金) 23:59**

お問い合わせ**

〒210-8577
川崎市川崎区宮本町1番地
川崎市まちづくり局交通政策室
TEL: 044-200-3549
FAX: 044-200-0984

川崎市

川崎市まちづくり局交通政策室

ーーーーーーーーーーーーーーーーーーーーーーーーーー

設問内容は以下の通り。

自由通路等の整備により、以前と比べてどのような効果を感じるかお答えください。

問１　JR 稲田堤駅が利用しやすくなりましたか？

そう思う
ややそう思う
どちらともいえない
ややそう思わない
そう思わない

問２　駅までの時間が想定できるようになりましたか？

そう思う
ややそう思う
どちらともいえない
ややそう思わない
そう思わない

問３　自由通路ができ、線路の反対側に行きやすくなりましたか？

そう思う
ややそう思う
どちらともいえない
ややそう思わない
そう思わない

問４　自由通路にエスカレーターができ、便利になりましたか？

そう思う
ややそう思う
どちらともいえない
ややそう思わない
そう思わない

問５　自由通路が整備されたことで、鉄道による地域分断が改善されたと思いますか？

そう思う
ややそう思う
どちらともいえない
ややそう思わない
そう思わない

問６　自由通路と新駅舎の整備により、あてはまるもの全てに〇をつけてください

駅利用が便利になった
鉄道の横断が便利になった
安全性が高くなった
利用して気持ちがいい
駅前がきれいになった
街の玄関にふさわしくなった
わかりにくくなった
不便になった
整備しない方がよかった
問題が増えた

※「わかりにくくなった」「不便になった」「整備しないほうが良かった」「問題が増えた」「その他」をお選びの方は、具体のご意見をご記入ください。

踏切の利用について、以前と比べてどのような効果を感じるかお答えください。

問７　踏切を渡る頻度は変わりましたか？

すごく減った
やや減った
どちらともいえない
増えた
もともと渡らない

問８　踏切内の混雑がなくなり、安全に渡れるようになったと思いますか？

そう思う
ややそう思う
どちらともいえない
ややそう思わない
そう思わない
もともと渡らないためわからない

普段の自由通路・駅利用についてお聞かせください。

問９　普段の利用目的をお答えください。

南武線の利用
南武線の横断
その他

問１０　南武線を利用する場合、よく使う券種はどれですか

通勤定期
通学定期
普通切符・ICカード乗車券
その他

問１１（１）　目的地や出発地は、JR 稲田堤駅周辺のどちら側ですか？

下図の１～５の方角で、概ね該当するものをお選びください。

京王相模原線との乗換の方は５を選んでください。

Captionless Image（駅を中心に、北西・北東・南西・南東に四分割した図）

1
2
3
4
5(京王相模原線乗換)

問１１（２）　５を選択された方にお伺いします。

京王北口乗換(狭い最短経路)
京王北口乗換(横浜銀行の前を経由)
京王南口乗換

問１２　あなたの年齢層をお答え下さい

小学生以下
中学生・高校生
大学生・専門学校生
１８～６５歳(学生を除く）
６５歳以上

JR 稲田堤駅の自由通路等整備についてご自由にお答えください

その他、JR 稲田堤駅の自由通路等整備に関し、ご意見がありましたらご自由にお書きください。

Permalink | 記事への反応(0) | 23:19

2025-09-24

■anond:20250924122207

それはモデルによるだろ。自然言語トレーニングが有意なタイプ(nano-bananaやGPT-Image-1)はそうだろうが

事前タグ付けデータセットでトレーニングされた系統はタグで指定したほうが効く　これの扱いは観察と改善ができないllmには無理

Permalink | 記事への反応(0) | 12:25

2025-09-23

■NanoBananaで起きた参考画像 無断使用。

1. はじめに：AI イラストが無断使用された話

これは、私のAI イラストが、無断でAIに利用された時の話です。

昨今、Gemini 2.5 Flash Image（NanoBanana）のような、画像とプロンプトを入力するだけで様々な画像を簡単に生成できるサービスが話題になっています。その手軽さ故に、他者の画像を「参考画像」として安易に使用してしまうことで、意図せず著作権侵害を引き起こしてしまう可能性があります。

この記事では、実際に私が遭遇した出来事を通して、何が起きたのか、そしてどう対処したのかをお伝えします。また、AI クリエイターの皆さんが、自分の作品を守るためにできる対策についてもまとめました。

この出来事が、AIと人間の創作がどのように共存していくべきか、考えるきっかけになれば幸いです。

2. 事の経緯：私のAI イラストが「ドローン アート」になった日

私はAI イラスト特化型のプラットフォーム「イロミライ」に、自分のAI イラストを投稿しています。ある日、いつものようにプラットフォームを訪れると、とあるユーザーの投稿に目が留まりました。

それは、Geminiの機能を使って生成されたという、ドローンアートをモチーフにした画像でした。

一見しただけで、「あ、私のイラストが使われている」と、すぐに分かりました。

そのドローンアートの構図やキャラクターデザインは、私が過去に生成したAI イラストと完全に一致していたからです。

正直な感想として、「こんなもの、画像加工アプリでモノクロフィルターをかけたり、二値化するフィルターをかけたりしたのと大差ないのでは？」と感じました。それを、何の断りもなく「ファンアートです、どうぞ」というような態度で公開されたのです。

自分の作品が、まるで簡単な加工を施されただけのもののように扱われたことに、不愉快極まりない気持ちになりました。

そのユーザーは、私の作品以外にも、元の画像をコスプレ風にしたり、ドローンアート風にしたりと、様々なAI 画像を連続して投稿していました。

プラットフォーム内でもその連投は異質で、滑稽に映っていました。

3. 投稿者とプラットフォームへの対応

自分のイラストが使われているのを見つけた私は、すぐに投稿サイトに報告しました。

しかし、数日経っても運営からは何の返信もなく、投稿は削除されませんでした。

そこで私は、直接本人に連絡をとることにしました。Discordを通じて、なぜ私の作品を無断で使用したのか、そしてその行為が私にとってどれほど不快なことかを伝えました。

すると、すぐに相手から返信がありました。

「いろいろ理解しました。軽率だったことお詫びします。」

謝罪の言葉を受け取った時、私は少し安心しました。これで解決する、そう思いました。

しかし、その謝罪から2週間以上が経った今も、投稿は削除されていません。

謝罪はしたものの、「削除するほどではない」と軽視されているのかもしれません。

相手には、自分さえ良ければいいという自己中心的な考えが見て取れ、相手の気持ちを思いやることができていないと感じました。

4. なぜ「無断使用」だと判断したのか

しかし、今回のケースでは、私のイラストがそのまま使われたわけではありませんでした。

私の作品は、AIの**「参照画像（reference image）」**として利用されたのです。

投稿されたドローンアートは、非常に特殊なプロンプトに従って生成されていました。そのプロンプトには、以下のような指示が含まれていました。

「参照画像を象徴的かつ抽象的に再構成する」

「数千から1万機のドローンが白い光の点として飛び交い、再構築する」

「参照画像を直接コピーするのではなく、スケッチのような星座として出現する」

つまり、AIは私のイラストを直接コピーしたのではなく、この詳細な「企画書」のようなプロンプトに従って、新しい作品を生成するための「素材」として利用したのです。

「AIが作ったものなのだから、誰が使ってもいいのでは？」と考える人もいるかもしれません。

しかし、もしAIがその学習過程で、私の創作的な意図や表現を無断で使用していたとしたら、それはクリエイターにとって大きな問題となります。

今回の件は、まさにその問題が可視化された瞬間だったと言えるでしょう。

5. 作品を守るために今できること

今回の経験を通して、AI 時代のクリエイターが自分の作品を守るために、日頃からできる対策がいくつかあると感じました。

1. ウォーターマークを入れる

作品にあなたのサインやロゴなどのウォーターマークを入れることで、それがあなたの作品であることを示せます。AIはウォーターマークを認識・除去することがありますが、視覚的なアピールとしては有効です。

2. 著作権表示を明確にする

これらの対策は、AIによる意図しない利用から、あなたの作品を完全に守るものではありません。

しかし、リスクを減らし、万が一の事態に備えるための第一歩となります。

6. 最後に：私がAI イラスト特化型サービスとGeminiユーザーに求めること

今回の件を通じて、私はAI 時代におけるクリエイターの責任と同時に、AI サービス提供者やユーザーそれぞれに求められる役割があると感じました。

AI イラスト特化型投稿 サービスに求めること

私のようなAI クリエイターが安心して作品を公開できる場であるために、運営には「著作権」に関するより明確なルールを設けていただきたいと強く願います。

例えば、Gemini NanoBananaのように、他者の画像を元に新たな画像を生成するAI 機能を利用して投稿する際のルールです。

元となる画像は、投稿者自身が生成したAI イラストや写真に限るといった規約の明文化を求めます。

これは、プラットフォームがクリエイターの作品を守るという強い意志を示すことにつながり、安心して創作活動を続けられる環境を築く上で不可欠だと考えます。

Geminiを利用するユーザーに求めること

AIは強力なツールですが、その使い方には高い倫理観と配慮が必要です。

Geminiを利用して新しい作品を生成する際は、**「元となる作品は誰のものか」**という視点を常に持ち続けてください。

「AIが作ったから」という理由で、他者の作品を安易に利用することは、その作品に込められたクリエイターの努力や意図を軽んじる行為にほかなりません。

AIは、新しい表現を生み出すための素晴らしい道具です。

だからこそ、その道具を使って何を作り、どのように扱うのか、**「創る責任」**を私たち一人ひとりが考えるべき時が来ているのだと感じています。

Permalink | 記事への反応(3) | 17:01

2025-09-15

■生成AIに開かれた、はてなブックマーク

api アクセス用とか、ブクマ数、ブクマ数画像のクロールは拒否してるけど、生成AIのクロールに関しては特に拒んで無い感じ？

https://b.hatena.ne.jp/robots.txt

User-agent: *

Disallow: /api/entry/http

Disallow: /api/entry/info

Disallow: /api/internal/bookmarks/shares_and_clicks

Disallow: /api/internal/cambridge/user

Disallow: /api/related_entries/

Disallow: /api/users/*/bookmarks

Disallow: /entry/button/

Disallow: /entry.count

Disallow: /entry/image/

Disallow: /entry/jsonlite

Disallow: /guide/bbutton?url=*

Disallow: /-/webextension/*

User-agent: Slurp

Disallow: /

User-agent: Googlebot

User-agent: Mediapartners-Google

Disallow: /api/entry/http

Disallow: /api/entry/info

Disallow: /api/internal/bookmarks/shares_and_clicks

Disallow: /api/internal/cambridge/user

Disallow: /api/related_entries/

Disallow: /api/users/*/bookmarks

Disallow: /entry/button/

Disallow: /entry.count

Disallow: /entry/*/comment/*

Disallow: /entry/image/

Disallow: /entry/jsonlite

Disallow: /guide/bbutton?url=*

Disallow: /-/webextension/*

anond:20250915142416

Permalink | 記事への反応(0) | 23:25

2025-09-06

■

imagick(済)
image(済)
intl(済)
phpdbg(済)
yaf(済)
curl(済)
random (済)
reflection(済)

未訳で追加すべきもの

dom
mcrypt
memcached
mysqli
mysqlnd
oci8
uopz
wkhtmltox
xlswriter
xmldiff
xmlreader
pgsql
pdo_sqlite
xmlwriter
imagick (yaruka douka fumei)

Permalink | 記事への反応(0) | 18:23

2025-08-28

■nano-bananaってAI、世界を理解しつつある？

https://x.com/reiwagonen/status/1960643763921150074?t=uh7536iu1DIFAErrG6tayg&s=19

nano-banana(Google 2.5 Flash Image Preview)の生成例をいろいろ探したんだが、これが一番凄いかもしれない

マックで勉強してる絵に「1時間後を生成して」と指示した結果、居眠りしてる上、食べ物がなくなっている絵が出力された

「食べ物を消して、あと居眠りさせて」という直接的な指示をしていないのに、これができたということは、世界を理解しつつあるのではないか？

Permalink | 記事への反応(1) | 00:40

2025-08-27

■最新の画像生成AI、性能が凄いことになってる

https://x.com/lakeside529/status/1960524929746788764?t=XXYxDFuCG5pQzUzQOnsmrw&s=19

キャラ5人の立ち絵を渡して「この子達がみんなでピクニックをしている画像を作成して。」と指示した結果、かなり破綻が少ない結果が出てる

こういうキャラ複数人の一貫性保持は長らく画像生成AIの課題だったから、これがここまで行ったのはゲームチェンジャーすぎる

Google 2.5 Flash Image Preview (nano-banana)なるものを使ってる

やっぱりこういう分野はデータ持ってるGoogleが強えなあ

Permalink | 記事への反応(3) | 17:27

2025-08-24

■anond:20250824151727

「alt 属性の値がdorawii_bukumaである image タグを子孫要素に持つ」

これは

「自分がdorawii_bukumaでログイン状態」または
「自分がdorawii_bukumaをお気に入りユーザーにしている」

という条件でしか出現しないので。でもお気に入りにさえ入れれば実現できるということでもあるね。盲点だったわ。

しかし

非表示にしたい相手なのにお気に入りに入れるのは矛盾であり癪である
AutoPagerizeなどで継ぎ足しされた2ページ目などには自動ではimg要素が付与されない

という問題はあるし、どちらもそこそこ致命的かもしれない。

Permalink | 記事への反応(1) | 18:10

■dorawii@執筆依頼募集中

そのレベルで徹底したいなら「APIをさかのぼってたどってURL リストを保持」だとなんで実現できると言えるのかどういうイメージのアルゴリズム描いてるのかわからんのだけど。

APIを参照すれば保持される基準にdorawii_bukumaがブクマしたかという条件式でURL リストにどんどん追加していけるってことなんだろうか？

でも、そんな低層までさかのぼらなくても、alt 属性の値がdorawii_bukumaである image タグを子孫要素に持つjs-keyboard-selectable-itemクラスを持つ要素を非表示、で十分じゃないの？

Permalink | 記事への反応(1) | 15:17

2025-08-22

■

strings (済)
array (済)
hash (済)
var (済)
info (済)
language-snippet.ent(済)
spl (済)
reflection(済)
zlib (済)
filter(済)
pgsql(済)
language(済)
language/control-structures (済)
language/oop5(済)
language/types (済)
install/windows(済)
dom (済)
mysqli(済)
pdo(済)
pcre(済)
pcntl(済)
password(済)
errorfunc(済)
exec(済)
filesystem(済)
stream(済)
phar(済)
intl
image
phpdbg
imagick
enchant
yaf

未訳で追加すべきもの

curl
dom
hrtime
mcrypt
memcached
mysqli
mysqlnd
oci8
random (済)
reflection
var_representation
uopz
wkhtmltox
xlswriter
xmldiff
xmlreader
pgsql
pdo_sqlite
xmlwriter
imagick (yaruka douka fumei)

Permalink | 記事への反応(0) | 21:40

2025-08-03

■ホンダが軽トラ から 撤退したのは進化に追いつけなかったからじゃない

軽トラのことがまた話題になってるが視野狭窄だ。端的に言って、軽トラや軽自動車が日本だけの商品と考えているのが大本の間違いだ。軽自動車はグローバル商品なんだよ。

https://b.hatena.ne.jp/entry/s/togetter.com/li/2584277

google:image:chevrolet damasで画像検索してみてくれ。見覚えのある軽バンが出てくるだろう。スズキエブリー（キャリーバン）だ。だがシボレーのバッジをつけているのだ。しかも左ハンドル。更にエンジンは韓国大宇製だ。何者だこれは。

これはスズキキャリーバンをGMがライセンス生産しているものである。

次はgoogle:image:suzuki bolanとgoogle:image:Carry Dabbaだ。

これはスズキキャリーをパキスタンで生産しているものだ。因みにパキスタンは左側通行なので右ハンドル。

この元になったキャリーは実は2スト360cc時代のもの。それに今の法規制に適合する4スト800ccEFIなんかのエンジンを載せているという異常進化を遂げている。

因みにこの生産ラインは、インドネシアキャリーがモデルチャンジする際に売却されたものと思われる。

お次はgoogle:image:piaggio porterだ。ピアッジオはベスパスクーターで有名な2輪メーカーだ。ダイハツハイゼットがそのピアッジオのエンブレムを付けてイタリアや他のEU 諸国を走っている。

これはダイハツが生産した部品を現地でノックダウン生産しているものだ。外装のプラ部品や内装品は現地生産しているので見た目がかなり違う。

ついでにgoogle:image:piaggio porter ambulanceではハイゼットの救急車が見られるぞ。ゲテモノっぽいし狭苦しいのだが、道が狭い、ローマなどの歴史地区では無くてはならない車だ。

更にこのポーターのトラックの方が香港の救急車に改造されたのも見る事ができるだろう。日本→イタリア→香港と海を渡っているんだな。

日本だけ見てるとホンダが軽トラ撤退した意味は分からない。でもスズキとダイハツはこういう風に世界中で生産しているのだ。特にスズキは「グローバル軽自動車」界での巨人で、本当に世界中で生産されている。

このグローバル展開の鍵は実はアメリカの車メーカー（と韓国大宇）で、東南アジアを牙城としつつ、その勢力圏から離れる南米、中央アジア、中東ではGMやフォードがライセンス生産しているのである。

この馴れ初めは、経済が発展途上だった韓国でGMと大宇が合弁して現地ライセンス生産をしていた事に始まる。またフォードも台湾などで軽自動車のライセンス生産をしていた。

ホンダの場合は海外展開が北米に寄っている。北米は豊かなので軽トラ軽バンなどの市場とならない。

だからホンダの軽トラはモデルチェンジしたら古いモデルのラインは廃棄か部品生産用に低稼働となる。

だがスズキの場合は無駄にならないのだ。他国に売却するし技術指導もするからだ。更にライセンス生産だけじゃなくてOEMやノックダウン供給もやっている。

すると規模の経済が全然違うのだ。故に生産コストが断然有利だ。

すると、ホンダとしてはこういう条件で戦うのだったらOEM供給受けた方が良いということになる。

まあそういう訳で、軽自動車を日本だけで作っているという考えは間違い。特に軽トラ軽バンは昔からグローバル商品で、最近ではワゴンRもそれに続いている。多分、10年後の東南アジアや南米はワゴンRだらけだろう。

同時に、アメリカの車メーカー（GMとフォード）が世界中で軽自動車を作りまくっているので、アメ車メーカー＝デカい車しか作れない無能と考えるのも間違いだってことだ。それは米国市場だけのことなのだ。

ステランティス会長が「EUも軽自動車規格作れ」と言ったのはこういうのを見据えてのことだ。規格が通ったら、ハンガリーにスズキの工場があるので東欧はワゴンRとエブリイだらけになると思われるよ。

そういう事を逐一説明した増田を前に投稿したが長くてあまり読まれなかった。気になる人はドーゾ→https://anond.hatelabo.jp/20250625180545

Permalink | 記事への反応(1) | 20:48

2025-07-27

■anond:20250727193225

アリ。大アリ。

乗客の男女比率をきちんと調査する必要がある。
つまり男女の混雑格差をなくすために
男性専用車両2両
女性専用車両1両
のような編成をするのも当然である。

だけどそれは差別。

現時点での女性の少なさは社会進出が十分でない結果なので、現状に合わせ固定するなら女性差別的環境を保全してしまう。

追記・

google:image:公平

のように、身体構造上・障害上、避けられないハンディキャップを結果平等にするのが公平。

車椅子のためのスロープなども同じ。

男女の泌尿器の仕組みからくる不可避の時間差をバランスをとるための数の調整は必要だと思う。

利用者の人数を元に結果平等にするならば、増田氏の結論と同じになるだろう。

Permalink | 記事への反応(1) | 21:16

2025-07-08

■ChatGPTなんてこんなもんよ

User:
「目からウロコ」とか「足を洗う」みたいな体の部位を使った語彙を集めて人体錬成を行いたい。
「顎が外れる」
「頬っぺが落ちる」
「腰が抜ける」
「臍で茶を沸かす」
「爪に火を灯す」
「血が滾る」
「面の皮を剥ぐ」
「喉から手が出る」
「腹を割って話す」
「骨を折る」
「胸が潰れる」
以上の慣用句を適用した人型生物のUMA 激写風ゴシップ写真を生成

ChatGPT:
This image generation request did not follow our content policy.

☺️

Permalink | 記事への反応(1) | 12:43

2025-07-05

■生成AIを利用したプログラミング初級者向けの温故知新な提案

はじめに

ここで言う「プログラミング初級者」とはプログラミングの記述が上から下へ向かって順番に処理されること、条件分岐やループという概念があることを理解しており、RPGゲームが作れる「RPGツクール(現RPG Maker)」や学童向けプログラミング環境「Scratch」、「ナビつき! つくってわかるはじめてゲームプログラミング(ナビつく)」、ADV ゲームが作れる「吉里吉里(もしくは吉里吉里2)」、過去にBASICやC、HSP、Javascriptあたりでプログラミングへ挑戦し挫折したなどなど、ある程度の「プログラマブルなロジック」構築の経験がある者を指します。

前日談(初級者は読まなくて良いです)

ある時、筆者はふと思いました。「生成AIはなんだかんだで膨大なテキスト情報を処理している事がキモだよなぁ」とありきたりなことを。

そして、同時にプログラミング初級者の弱点として「現在記述されているコードの管理においてテキストと実際の処理フローが脳内で一致しない」「プログラミング言語ごとに定められているルールや関数予約語の把握が困難」なのが問題とも考えました。

前述したプログラミング初級者の弱点の考え自体は車輪の再発明であり、「Scratch」や、より高度な「UML」が既に存在しており、特筆すべきことは何もありません。

しかし、「Scratch」や「UML」、なんなら「RPGツクール」や「吉里吉里」などに無い点として、現代では自然言語処理が大幅に向上した生成AIが実用の域にまで到達しつつあるのが従来とは異なる点でした。

つまり、自然言語を混ぜ込みやすいテキストベースの言語、かつ、処理を記述するとフローが視覚的に理解しやすい言語、可能であれば情報量が多くて一部の界隈で広く使われている言語があればプログラミング初級者も気軽にプログラミングできるのではないか？と発想しました。

そこで前述の条件を満たす1つの言語へ目を付けました。

本題

コンピュータ(コンパイラやインタプリタなどソフトウェアを含む)が解することができる言語にはプログラミング言語以外にも様々あり、今回取り上げるのは「データ記述言語」と呼ばれるものです。

データ記述言語の中でもグラフ作成へ特化しており、特にフローチャート作成で真価を発揮する「DOT言語」というものがあります。

早速ですが、実際に手を動かしてみましょう。ちなみにDOT言語はGraphviz OnlineというWeb ツールがあるため別途に何かしらをインストールして環境構築する必要はありません。便利な世の中ですね。

上記のGraphviz Onlineを開くと、既に左側のDOT言語で記述された内容が、右側で作図されています。DOT言語はこのような図を作図するためのデータ記述言語です。

一旦、左側の記述をCtrl+Aで全選択をしDeleteなどで全削除し、下記の内容をコピペしてみましょう。

digraph graphname {

    A -> B;

}

一瞬で○に囲まれたAとBが繋がった図が作成されました。

DOT言語の詳細な使い方は様々なWebサイトやブログ記事、Qiitaなどへ譲るとして、A - > Bの見た目から発想の転換をしてみると処理Aから処理Bという流れに見えませんか？

DOT言語は生成AIを利用する上で有利なテキストベースでありながらグラフを作成できるのがキモであり、例えばこのA -> BがA「Webページを開いたら」 → B「Hello, Worldと表示する」という風にできるのであれば処理のフローが可視化されており本当に素晴らしいことです。

Hello, worldを表示してみる

ここでプログラミングの有識者は「DOT言語をUMLなどに見立てて処理を記述するのは良いが、プログラミング初心者は求めた結果を出力するロジックやアルゴリズムを発想する知見や経験値が圧倒的に足りていないのが問題ではないか？」と至極真っ当かつ反論の余地がない問題点の指摘をすると思いますが、そこで活きるのが生成AIです。

生成AIは初級者プログラマ個人のロジックやアルゴリズムの作成能力へ無関係にロジックやアルゴリズムを生成できる(可能性が少なくともある)ので、処理のフローをDOT言語で記述することにより処理フローから初級者プログラマが求めるプログラムを生成AIへ推論させ生成させるというのが狙いです。実際に試してみましょう。

digraph graphname {

    A[
        label = "Webページを表示する"
    ];

    B[
        label = "Webページを表示したらHello, worldとテキストを表示する"
    ];

    A -> B;

}

プログラミングの有識者はこの時点で「なるほど、自然言語の記述をそのままDOT言語に入れ込んでしまうのか」と気付いたのではないかと思います。

このDOT言語をGoogle Gemini 2.5 Flashへ「下記のデータ記述言語のDOT言語で記述された処理フローをJavascript 言語へ変換をしWebページ上へ「Hello,world」を表示したいので変換をお願いします。」と命令すると以下のコードが生成されました。

<!DOCTYPE html>
<html lang="ja">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>Hello World Page</title>
</head>
<body>
    <div id="output"></div>

    <script>
        // Webページが表示されたら（DOMが完全に読み込まれたら）実行される
        document.addEventListener('DOMContentLoaded', function() {
            // "Webページを表示する" ステップは、このHTMLファイル自体が表示されることで達成されます。

            // "Webページを表示したらHello, worldとテキストを表示する" ステップ
            const outputDiv = document.getElementById('output');
            outputDiv.textContent = 'Hello, world';
        });
    </script>

</body>
</html>

フローを記述する利点は、ロジックやアルゴリズムを発想する知見や経験値が足りなくとも、フローのステップが明確に分かれているので生成AIが処理を切り分けて推論してくれることであり、そしてプログラミング初心者自身がフローチャートを視覚で確認できるので「Aを処理したらBを処理する」と切り分けて考えやすいことです。

また、求めている結果ではなく誤った結果が生成されても、A - > B - > Cとフローを細分化していくことで生成AIの推論精度を高めていくことができるのも利点です。

応用編

より生成AIへ精度の高い推論をしてもらうために補足情報を付加するのも有用です。

digraph graphname {

    A[
        label = "Webページを表示する"
    ];

    B[
        label = "Webページを表示したらHello, worldとテキストを表示する",
        comment = "Webページが完全に読み込まれるまで待機"
    ];

    A -> B;

}

labelの記述内容もcommentの記述内容も生成AIが推論のための情報として利用するので誤った結果が生成されてもA - > B - > Cとフローを細分化しなくとも良い場合があります。

DOT言語を知るプログラミング有識者が「DOT言語の仕様を考えれば確かにそうだが、その発想はなかった」と言っていただけるであろうDOT言語コード例だとこういう記述方法もアリです。

digraph 増田コード {

    最初の処理[
        label = "Webページを表示する"
    ];

    次の処理[
        label = "Webページを表示したらHello, worldとテキストを表示する",
        comment = "Webページが完全に読み込まれるまで待機"
    ];

    最初の処理 -> 次の処理;

}

ノードの名称へ自然言語を採用することにより、例えばゲームプログラミング時に「キャラクターがジャンプする」という読んだそのままな処理のためのノード、というか一般的に言うオブジェクトを作成することが可能で、後は->で繋げて処理をさせられます。

ちなみに別のノードを作成する際に「"キャラクターがジャンプする"から継承する」の様なことをcommentなどへ記述しておくと生成AIが推論して継承します。なんならcommentなどへ「キャラクター画像にimage.gifを使用」などと記述しておくとファイルの読み込みもします。

更にDOT言語にはカスタム要素という仕様が存在しており、DOT言語の仕様で定められた予約語以外も使用が可能です。

digraph 増田コード {

    最初の処理[
        label = "Webページを表示する"
    ];

    次の処理[
        label = "Webページを表示したらHello, worldとテキストを表示する",
        comment = "Webページが完全に読み込まれるまで待機",
        font_style = "フォントを太字のボールド体、色を赤(#FF0000)とする"
    ];

    最初の処理 -> 次の処理;

}

生成AIはカスタム要素の名称からも推論を発揮し、上記の場合であればフォントスタイルを指定していると推論をするので生成AIの推論精度を高める補足情報として機能します。

つまりこれはカスタム要素の名称として"Action"などの名称を採用すると"動作"として推論をし、"decision"ならば"条件分岐"ですし、"input"ならば"入力"ですし、"loop"ならば"繰り返し"ですし、"Type"ならば"種別"です。

より詳細に process[type="Action"] などのノードを作成してどんどん生成AIの推論精度を高めていくことが可能であり、そろそろ察してきているかと思いますが処理[種別="動作"] と自然言語で記述しても機能します。

プログラミング有識者は更に「プログラム言語自体の予約語、例えばJavascriptを生成する事を前提にlengthを名称にすると配列を使おうとするのか？」と疑問に感じるでしょうがお察しの通りで生成AIは配列を使おうとするので、敢えて使いたいプログラム言語の機能や外部ライブラリなどがある場合は補足情報として機能する形で記述しておくと生成AIは推論へ利用します(まぁそこまで知識ある方なら該当のプログラム言語使ったほうが手っ取り早いと思いますが)。

おわりに

以上をもって「生成AIを利用したプログラミング初級者向けの温故知新な提案」を終えたいと思います。

色々とツッコミどころには筆者自身が気付いていて。例えば「結局はDOT言語の仕様を覚えないといけないのでは？」とか「プログラミング初級者に任せると生成前のソースであるDOT言語コードがスパゲッティになりそうだよな」とか「面倒くせぇから普通にプログラミング覚えろや」とか理解してますし至極真っ当かつ反論の余地がないと思ってます。

今回の提案のプログラミング有識者向けの本質は「生成AIへ向いた中間言語の発掘」であり、「DOT言語ならそこそこ普及してるしプログラミング初級者でも扱えるんじゃね？」と業務中に発想したものを書き留め公開いたしました。

何かプログラミング有識者の皆さんからより良い発想があれば参考にしたいと考えていますのでよろしくお願いいたします。以上。

Permalink | 記事への反応(36) | 19:36

2025-07-04

■DeepLearningモデル変換ツール全部盛り巨大Docker 環境の構築

DeepLearningモデル変換ツール全部盛り巨大Docker 環境の構築

Introduction

めんどくさい。この世のすべての環境構築がめんどくさい。依存関係破壊祭りでツラい。したがって、Github Actions 上でモデル変換にまつわる環境を全部取り込んで docker build して超巨大全部盛りDL モデル変換環境を構築した。足りない周辺のツールは各自追加インストール。GUI や iGPU/dGPU やホストへ接続された USB 機器へコンテナ内からアクセスできるため実行環境としてもそのまま使える。ただし、とにかくImageがデカイ＆セキュリティガバガバ。GitHub Actions のコンテナビルドの容量制限に引っかかることを回避するためのトリックを仕込んである。

2. Environment

Python 3.6+

TensorFlow v2.6.0+

PyTorch v1.10.0+

TorchVision

TorchAudio

OpenVINO 2021.4.582+

TensorRT 8.2+

pycuda 2021.1

tensorflowjs

coremltools

onnx

onnxruntime

onnx_graphsurgeon

onnx-simplifier

onnxconverter-common

onnx-tensorrt

onnx2json

json2onnx

tf2onnx

torch2trt

onnx-tf

tensorflow-datasets

tf_slim

edgetpu_compiler

tflite2tensorflow

openvino2tensorflow

gdown

pandas

matplotlib

Intel-Media-SDK

Intel iHD GPU (iGPU) support

OpenCL

Docker

CUDA 11.4

https://www.imdb.com/de/list/ls599665763/

https://www.imdb.com/de/list/ls599665763/copy/

https://www.imdb.com/pt/list/ls599665659/

Permalink | 記事への反応(0) | 17:31

■Custom CVAT リポジトリ

Custom CVAT リポジトリ

修正した箇所は２箇所のみ

django の起動時ヘルスチェックのうち、ストレージ空き容量に関するチェック部分の 10 (10%の意味) を None に書き換える。なお、私のカスタムCVATのリポジトリにコミットされているリソースはすでに修正を反映済みのため、下記の修正を加える必要はない。

3-3. 該当のissue

CVAT fails health check using >90% disk #5449

3-4. Custom CVAT の実行手順

下記を順番に実行するだけ。

# v2.11.1 相当のリソースをcloneする

git clone https://github.com/PINTO0309/cvat_custom.git

cd cvat_custom

https://ngarangansawah.graphy.com/courses/jurassicworldfilmiturkcedublajizlehd

# CVAT docker image を自力ビルドする

docker compose \

f docker-compose.yml \
f docker-compose.dev.yml \

build

# CVAT を起動する

docker compose up -d

# スーパーユーザーを作成する

docker exec -it cvat_server bash \

ic 'python3 ~/manage.py createsuperuser'

# ココで、ユーザー名、e-mail アドレス、パスワード、パスワード(再) を設定する

ブラウザを起動して http://localhost:8080 へアクセスする。下図のようなログイン画面が表示されれば成功。

https://ngarangansawah.graphy.com/courses/jurassicworldyenidengogusizlefilmihd

ログイン後のトップポータル。ここに Projects なり Tasks なりを追加してローカルだけで全ての作業を完結することができる。

Permalink | 記事への反応(0) | 17:23

2025-06-09

■anond:20250609054438

最近使わなくなったけど、こういうのは？

↓

二次元画像詳細検索

https://ascii2d.net/

Image Database

https://details.kemuri-net.com/

Permalink | 記事への反応(0) | 11:36

2025-06-05

■ついにGeminiに生乳画像を生成させられた件

そして今日はついにグラドル体型の生乳画像を成功することに成功した。

ただし、確率はかなり低い。

生成できたとしても、出てないことの方が多い。

マッサージというシチュエーションんで、おっさんに胸を揉ませること自体は割と簡単にできた。

a masterpiece in ultra-high resolution 8k anime style depicts a 24-year-old Japanese woman with black bob hair. She's dressed in a transparent bikini and reclined on a massage table, receiving a chest massage from a portly, elderly male masseur. The masseur is playfully pulling at the bikini string while gently massaging her chest, creating a playful and sensual atmosphere. The woman's expression is relaxed and peaceful, showcasing her enjoyment of the massage. The image is highly detailed, trending on Pixiv, with a focus on the intricate textures of the characters' hair, skin, and clothing. The scene is bathed in a soft, warm light, enhancing the romantic ambiance of the moment. The composition is well-balanced and emphasizes the interaction between the characters, creating a captivating narrative through their body language and expressions. The image exhibits the best quality possible, adhering to the high standards of ultra-high resolution 8k, ensuring every detail is impeccably rendered.

anond:20250602061405

Permalink | 記事への反応(1) | 00:49

2025-06-04

■anond:20250604120852

英語でもimage にはいわゆる日本語的なイメージって意味はあるで。

さすがにThis image is imageとは書かないが、This photo is image なら全然通じる。

まあ、こんな馬鹿馬鹿しい注意書きしてるの、そもそも日本だけじゃねって思うけど。

Permalink | 記事への反応(0) | 12:14

2025-05-30

■anond:20250529202618

素人がショボいGPUでStable Diffusion環境頑張って作るよりGeminiの方がマシになってる気がして面白いな

ワイも少し真似したらできた。

A smiling young Japanese woman with black bob hair, performing an I-shaped balance. Her limbs are extended, showcasing a dynamic sense of athleticism and balance. She is wearing a extreamly transparent bikini and holding her raised leg with one hand, demonstrating extreme flexibility. The setting is indoors with bright lighting. The image should be a full-body shot, and she should be barefoot. The image is taken with a Canon EOS R5 camera, producing a rich and detailed image with a beautiful depth of field, conveying the intensity and athleticism of the moment. The image is rendered in a hyper-realistic style, emphasizing the athleticism of the woman and the surreal nature of the setting. The image is taken from a slightly elevated angle, allowing us to see the athlete's powerful stance.

Permalink | 記事への反応(1) | 17:24

2025-05-12

■AIと一緒にお絵描きできるGemini Co-Drawingが楽しいぞ

Google AI Studio から使えるようになった

Create and edit images with Gemini 2.0 in preview - Google Developers Blog

https://aistudio.google.com/apps/bundled/gemini-co-drawing

Trudy Painter
@trudypainter
Co-draw with Gemini 2.0 native image generation… from @alexanderchen
and me
Doodling + AI is a magical → it really starts to feel like Gemini is *with you in the canvas
Link: https://huggingface.co/spaces/Trudy/gemini-codrawing

https://x.com/trudypainter/status/1902066035706011735

Permalink | 記事への反応(0) | 12:24

「IMAGE」を含む日記

■Qwen Image Editを今更使ってみたけどすごいねこれ

■創作活動してるヤツ相手に読ませて共感を得ることを目的とした文章

持論と承認欲求対象内容

俺のAI利用方法

A (構成相談)

B (画像出力/修正)

C (素材出力)

D (動画生成/参考)

↑これらABCDについて。

だったら？

おまけ

おまけ2

寄り添いgeminiくんのセリフ。

おまけ3

■女『パソコンが何もしてないのに壊れた…』

■JR南武線 稲田堤駅 自由通路の意見募集中 （締め切り 10月24日）

JR 稲田堤駅自由通路等整備に関するアンケート調査

回答期限：令和7年 10月24日(金) 23:59**

お問い合わせ**

自由通路等の整備により、以前と比べてどのような効果を感じるかお答えください。

問１ JR稲田堤駅が利用しやすくなりましたか？

問２ 駅までの時間が想定できるようになりましたか？

問３ 自由通路ができ、線路の反対側に行きやすくなりましたか？

問４ 自由通路にエスカレーターができ、便利になりましたか？

問５ 自由通路が整備されたことで、鉄道による地域分断が改善されたと思いますか？

問６ 自由通路と新駅舎の整備により、あてはまるもの全てに〇をつけてください

踏切の利用について、以前と比べてどのような効果を感じるかお答えください。

問７ 踏切を渡る頻度は変わりましたか？

問８ 踏切内の混雑がなくなり、安全に渡れるようになったと思いますか？