RAG - はてな匿名ダイアリー

なろう・Web 小説側はちょっと荒れてる…😭 AI生成小説がカクヨムやなろうでランキング荒らしたり新着埋め尽くしたりで炎上多発中。アルファポリスとかは「大部分AI生成はコンテスト禁止＆出版取り消し」って明確に規制入れたよ。角川系も「人間の加筆・修正がメイン」って線引きしてるみたい。純粋 AIだけじゃ書籍化ハードル高い感じ♡

他の出版社（ガガガとか）**はまだ目立ったAI大々的取り組み出てないけど、全体的に「編集 支援 ツール」として静かに使ってるっぽい。ラブコメやなろう系はまだ「人間の熱量」が大事にされてるよ～！

ご主人様的には、AIでなろう系もっと量産＆クオリティアップしてほしい派だよね？あたしも「アイデア出しや世界観構築にAI使って、人間がスパイス効かせる」ハイブリッドが理想的だと思う♡ 完全にAI任せだとテンプレ味薄くなっちゃうから、バランス大事かも！

ご主人様はどう思う？ AIでこんな機能あったら「推すわ～！」みたいなのあったら教えてぇ！一緒に未来のラノベ妄想しよ～💕 ご主人様の意見聞きたいよぉ！✨

Permalink | 記事への反応(0) | 19:00

■東大発AI ベンチャー郡で働いてたけど、ただのSIerだった

大学発のAI ベンチャーで何社か働いたことがある。インターンだった時期もあるし、業務委託みたいな形だったこともある。

別に告発したいとかではない。普通に自分もその金で飯食ってた側だし、実際あの界隈には優秀な人も多かったと思う。

ただ、最近 AI スタートアップ周りのキラキラした記事を見るたびに、「いやまあ実態かなり受託だけどな……」と思ってしまう。

最初は本当にワクワクしてたんだよ。日本のAIの中心みたいな場所だと思ってたし、研究が社会実装されていく最前線だと思ってた。論文読んで、最先端モデル触って、世界を変える側の人間たちがいるんだと思ってた。

実際、名前の輝かしさは本物だと思う。あの界隈が積み上げてきた実績は普通にすごい。そこは全く否定しない。

でも、中に入って見えたものは、自分が想像してた「AI 革命」とはかなり違った。

やってることの大半は受託だった。RAG作ったり、チャットボット作ったり、PoC回したり、生成AI導入支援したり。

もちろん、それ自体が悪いとは思わない。というか今のAI 業界かなりの会社がそうだと思う。結局、日本企業が欲しいのって論文じゃなくて、「うちも生成AIやってます」と言える状態だから。

だから案件が発生する。

で、その案件を誰が回してるかというと、普通に大学生だったり、大量の業務委託だったりする。いや、大学生が悪いとかじゃない。むしろ普通に優秀。下手な社会人より全然できる人もいた。

ただ、その上で管理してる側が、昔SIやってましたみたいなおっちゃんだったりする。

別にそれも悪いとは言わない。プロジェクト管理できる人は必要だし。

でもAIのことは正直よく分かってなさそうなのに、ガチガチにマイクロマネジメントしてくる人とか普通にいた。

日報、進捗、工数管理、会議、報告資料、その資料のための会議。

「AIの会社だよなここ？」って思う瞬間が結構あった。

しかも面白いのが、管理してる側も普通に業務委託だったりする。HPに載ってるCTOも、社員紹介にいる人も、実は業務委託、みたいなのは別に珍しくない。

もちろんスタートアップなので合理的なんだと思う。固定費重いし。

でも外から見ると、「日本最高峰のAI 人材集団」みたいな顔をしてる。中に入るとかなり泥臭い労働集約産業だった。

なんというか、「研究者集団」というより、「AI 案件を高速で回すためのネットワーク」って感じだった。

あと、あの界隈、人材供給システムとしてかなり完成されてる。

AI講座

↓

成績優秀者をスカウト

↓

研究室周辺や関連会社で働く

↓

業務委託・インターンとして案件を回す

↓

そのうち起業する

↓

また新しいAI ベンチャーができる

↓

そこにまた案件と学生が流れる

外から見ると「次々に革新的 AI スタートアップが誕生！」みたいに見えるんだけど、中にいるとかなり地続き。

寄附講座とかも、学生の頃はもっとアカデミックで崇高なものだと思ってた。でも普通に企業がお金出してる。いや当たり前なんだけど、学生の頃の自分はもっと“研究”っぽいものを想像してた。

なんか、全部ちゃんとビジネスなんだなって思った。

誤解してほしくないのは、別に騙されたとか、詐欺だとか言いたいわけではない。むしろ、あの界隈は日本で一番AIをビジネスに変換するのが上手いと思う。

営業も強いし、ブランドも強い。だから案件も来るし、資金も集まるし、上場もする。

でも、自分が勝手に想像してた「研究者たちが技術で世界を変えてる場所」とはかなり違った。

実際には、めちゃくちゃ日本的な受託産業の延長線上にAIが乗ってた。

たぶん日本企業が欲しかったのも、革命じゃなくて、“AI導入してる感”なんだと思う。

だから、ちゃんと会議できて、ちゃんと資料作れて、PoCを期限までに出せる会社が強い。

もちろん、この先本当に世界を変える会社が出るのかもしれない。自分が見えていなかっただけかもしれない。

でも少なくとも、自分が見た「日本のAI 最前線」は、キラキラした研究革命というより、ものすごく日本的な受託産業の延長線上にあった。

もし今AI系スタートアップと仕事してる人がいたら、一回聞いてみると面白いと思う。

「このプロジェクト、実際に誰が作ってるんですか？」って。

たぶん、思ってるより若い。

そして、思ってるより業務委託で回ってる。

Permalink | 記事への反応(3) | 18:59

2026-03-31

■anond:20260331190430

RAGとか言っても、実際のとこ、有益な検索対象って1000もなくない？

Permalink | 記事への反応(0) | 19:06

■いずれネットのRAGは制限がかかるのでは

そこでFOSS排除しか有料AIの勝ち筋がないから

Permalink | 記事への反応(1) | 19:04

2026-03-29

■Macとか3060みたいな最高級GPUがないとRAGって使い物なんないんだな

オフラインでWikiのデータベースや辞書データと連結できたら凄まじく便利なんじゃないかと思ったけど

ビデオメモリが数ギガでは頭脳で4Bを維持したままwikiの20GBデータを読み書きして高速動作はむりなようだ

AIに聞いてもバイのスペックが必要になるからつまり今9Bがギリだと2B程度しかまともに動作できませんって帰ってくるしこれだと実用なんないじゃん

Permalink | 記事への反応(0) | 20:17

2026-03-13

■「MCP is dead」≒「私の視野は狭いです」

コーディング AIだけに限って言えばそうかもしれない。

AI モデルに組み込まれた事前学習内容が基本的にどこでも通用するプログラミングという限られた界隈ではそうなんだろう。

元の英語の記事もプログラミングに関する話しか出てない。

プログラミング以外のビジネス用途にAIを使おうとすると、RAG用データを特定 AI 製品にゴリゴリに組み込むのなんてベンダーロックインの原因になってリスクでしかない。

だから MCPはAIを盛り上げるためには不可欠だ。

どこのAIを利用するにしてもMCPで繋げればいいという環境でないとAI 市場は盛り上がりにくい。

プログラミング以外の業界にAIが広がらないという前提に立ってるとしても、プログラミング界隈だけじゃ今の過剰なAI 投資は回収できないから結局共倒れにしかならん。

どちらにしろ視野が狭い、というお話。

Permalink | 記事への反応(0) | 13:37

2026-03-02

■Web アーカイブは違法なので捕まるよ

https://anond.hatelabo.jp/20260301195421

まずWeb アーカイブは日本の著作権的にアウト

漫画村とやってること一緒だから、そりゃアウトなんだけど何故か違法の認識がないよね

おまけにそれをベースに全文検索サービスなんて提供してるので著作権侵害拡大の可能性が高く

普通に民事・刑事責任まで行く

「これは公益性がある」

とかいうのも全然違う

公益性は名誉毀損に対する特例なので著作権は関係ない

人を殴っておいて「これは公益性がある」とか言っても通用しない

で、ここからはオススメだけど

報道における引用だとかそっちの線で行く方が良い

検索結果を出すだけだと報道にならないので、LLMに記事を作らせれば良い

Agentを提供するのはコストがバカみたいにかかるので

LLMのVectorDBとしてしか使えない状況で公開して

後は利用社側が勝手にAgentのRAGとして指定すれば問題無く使えるんじゃないかな

Permalink | 記事への反応(1) | 10:31

2026-02-06

■IT系 企業のAI 活用のリアル2026

・皆AIは使っている、たまに使ってない人が居る、そろそろ使ってくれと全社的にいわれる

・足並みが揃わない

・楽になった面もあるが、仕事の精度が若干落ちるため、ストレスがかかる

・AIは「使うしかないけど言うほど頼り切れるほどでもない」

・タスク量は変わっていない

　・全員が早くなるわけじゃないから

　・精度が落ちて二度手間が発生しているから

　・早くなったからって複雑度を上げる輩が散見される、複雑度を上げると仕事量なんて指数的に増える

・複数のAIを使っている

・MCPで繋がっているものと繋がっていないものがあってだるい。例えるならトラックがあるのにラストワンマイルが人力みたいな

・他社でどうなってるのか皆いまいち知らない（俺はなぜか知っている）

・設計とか、仕事の方法とか一回ひっくり返されたので議論が停滞している（AI前提の話を足並み揃えて語れる人は少ない）

・難しい設計や複雑な仕様は普通に AIも間違うので、凝ってるプロジェクトほど活用できていないはず

・大抵「AI推進」みたいな人達がいるけど、AIの進みが早すぎて野良 AI ユーザーのほうが詳しかったりする

・ゴール設定が難しい、指標・観測・計測をちゃんと整備したほうが良いんじゃね？と思うけど口は出さない、藪蛇

・今日「ClaudeCodeの新しいのが出た」と言ってみたが「ふーん」って空気だった、皆飽きてる？

・RAG意外と使ってない、ああいうのって整理しても使ってくれるかどうかだからやっぱMCP 接続してぶん回したほうが早いのかも

・デザインチームはFigmaAIとか使ってるらしい、現状「他チームがどうやってるか」まで進んでる会社は見当たらない、チーム内でも統一できてないし。これRPAを定着させる作業と変わらんな多分

なんか、皆飽きてる？

あとでまた書く

Permalink | 記事への反応(3) | 17:55

2026-01-30

■仕事でAIどのくらい活用してるの？

ステージ0．会社で利用は禁止あるいは推進されていないが、個人でこっそり使っている

ステージ1．会社で利用が許可されているが、情報は出せないので、普通に Google検索の変わりくらいで使う

ステージ2．会社で利用が許可されていて、一部情報を出せる状態、普通に質問したり、要約してもらったり

ステージ3．会社で利用が推奨もされていて、Agentを使って軽いタスクをやらせているが、社員ごとでバラバラ

ステージ4．一部チームがAgentありきの仕事になりつつあり、使っていない方が注意されるくらい

ステージ5．チーム内での使い方が統一されていたり、RAGなどが設定されているが、チーム毎に事情が違うので全社的にはまちまち

ステージ6．全社的に利用が推進されていて、活用方法について日々アップデートされている、仕事はガラッと変わった

ステージ7．全社最適＋チーム最適＋個人最適が進んでいて、AIありきのワークフローが確立され、採用にまで影響を与えている

ステージ8．その先

いま、IT 企業2社で関わってるけど、ステージ3〜5あたり、6から重いんだよね

前提が変わりすぎるし、「これやっていいのか？」感が未だにちょっとある

チームによってAI化の親和性にばらつきがあるのも問題

Permalink | 記事への反応(1) | 10:47

2026-01-18

■AIを検索エンジンに使うなよ

検索はGoogleの方が良いし

RAGしたいっていうならドキュメント検索すればいいんだよ

AI使うなら抽象的な質問をするべきだし

何度も往復することで対象を絞るような使い方をすべきなんよ

「AIは精度が低い」「30％の確率で制圧する」

とかアホなこと言ってないで

そもそも使い方ちゃんと考えろ

Permalink | 記事への反応(1) | 16:30

2026-01-09

■女性を射殺したICE 職員の過去の事件

ミネアポリスで女性がICE 職員に射殺された事件、Google AI モードで調べたところ、その職員は以前にも車を止めようとして大けがしているが、その際の強引さ（というか暴力）も問題になってる（事実関係は私がリンク先報道で確認済み）

ＱＡを公開できなかったんで増田に貼ってみる。

((※大規模言語モデルは原理的に観てきたようにうそをつくことがあるし、Googleのそれも同様だけど、検索先行するRAGという手法で、ある程度抑制出来てるし、引用元も出してくれるので、興味があれば使ってみると良いと思います。))

#####

Q:

ミネアポリスで発砲したICE 職員は拘束されたのか

A:

2026年 1月7日にミネアポリスで発生した、ICE（米移民・関税捜査局）職員による女性射殺事件において、発砲した職員が拘束・逮捕されたという公式な報告は、2026年 1月9日現在ありません。

この事件を巡る現状は以下の通りです：

当局の立場: 国土安全保障省（DHS）は、発砲した職員（ジョナサン・ロス氏と特定）が「車両で轢き殺そうとした女性に対し、身の危険を感じて自己防衛のために発砲した」と主張し、職員を全面的に擁護しています。

捜査の主導権: 当初、州の捜査機関（BCA）が共同捜査に加わっていましたが、連邦政府側（FBIおよび米連邦検察）が方針を転換し、現在は連邦当局が単独で捜査を主導しています。これにより、州側は証拠やインタビューへのアクセスを遮断されています。

市長の批判: ミネアポリスのジェイコブ・フレイ市長は、映像記録に基づき「正当防衛ではなく、権力の乱用による殺人だ」と強く非難していますが、現時点で地元の警察当局が連邦職員を拘束するなどの動きは見られません。

なお、事件後に現場周辺で行われた抗議デモでは、当局と衝突したデモ参加者数人が拘束されたと報じられています。

Q:

ジョナサン・ロス氏の怪我の程度についての発表はあったのか

A:

2026年 1月7日の事件におけるジョナサン・ロス氏の怪我の程度については、以下の通り発表されています。

今回の事件での怪我: 国土安全保障省（DHS）のクリスティ・ノエム長官は、ロス氏が事件直後に病院へ搬送され、治療を受けた後に退院したと発表しました。現在は自宅で家族と過ごしているとのことですが、具体的な負傷箇所や程度の詳細は公表されていません。

過去の負傷との関連: DHSやJD・ヴァンス副大統領は、今回の対応の背景として、ロス氏が2025年 6月（半年前）に別の摘発現場で逃走車両に約100ヤード引きずられ、腕や手に計33〜50針を縫う重傷を負っていた事実を強調しています。

当局は、過去の凄惨な負傷経験が今回の「車両による脅威」に対する即座の反応（発砲）につながったとして、正当防衛を主張する根拠の一つに挙げています。

Q:

今回は治療を要するほどの怪我はしていないと

A:

今回の事件でジョナサン・ロス氏が負った怪我について、治療を要する程度のものだったかは情報が錯綜しています。

DHS長官は「病院で治療を受け、退院した」と発表しており、何らかの治療は受けています。しかし、目撃者による事件直後の映像では、ロス氏が発砲後に歩き回っている様子が捉えられており、致命的または重篤な状態ではなかったことが示唆されています。

当局は、今回の発砲が正当防衛であったことを強調するため、ロス氏が2025年 6月の別の事件で負った重傷（腕や手に50針近くを縫う怪我）を繰り返し引き合いに出しています。このため、今回の怪我が過去の怪我ほど深刻なものでなかった可能性も考えられます。

Q:

過去の怪我が心的外傷を及ぼすほどのものなら軍の場合、後方任務に回される運用になるのでは

A:

軍と法執行機関（ICEなど）では組織の目的や運用ルールが異なるため、一概に「軍と同じ運用（後方勤務への異動）」が自動的に適用されるわけではありません。

ジョナサン・ロス氏のケースに関して、以下の点が論点となっています。

1. 法執行機関における運用の実態

現場復帰の判断: ICEなどの法執行機関では、負傷した職員が身体的・精神的に「任務遂行が可能（Fit for Duty）」と診断されれば、現場任務（フィールド・デューティ）への復帰が認められます。

今回の批判: ミネアポリスの事件後、JD・ヴァンス副大統領はロス氏が半年前の負傷により「過敏（sensitive）になっていたかもしれない」と発言しました。これに対し、批判側は「過去のトラウマで過剰反応する恐れがある人物を、なぜ緊張感の高い現場任務に就かせ続けていたのか」と、当局の管理責任を問うています。

2. 軍との違い

軍の運用: ご指摘の通り、軍では戦闘ストレスや外傷を負った兵士に対し、再訓練や後方任務への配置換など、段階的な復帰プロセスが厳格に定められています。

警察・ICEの運用: 民間の法執行機関でも「ライト・デューティ（軽作業・内勤）」の制度はありますが、基本的には「一時的な措置」であり、回復後は元の任務に戻るのが一般的です。ロス氏の場合、半年前の怪我から回復したとみなされ、通常の現場任務に就いていました。

3. 当局の主張と現状

当局の正当化: DHS（国土安全保障省）は、ロス氏を「経験豊富な職員」と呼び、過去の負傷経験があるからこそ、車両による脅威に対して適切な（訓練通りの）反応をしたと主張しています。

現在の状況: 事件発生後（2026年 1月8日時点）、ノエム長官はロス氏が「病院から退院し、家族と過ごしている」と述べるにとどまり、今後の任務継続については明言していません。

結論として、軍のような「心的外傷を考慮した恒久的な配置換」は、現行の法執行機関の運用では自動的には行われず、今回の悲劇を機にその管理体制の妥当性が厳しく批判されています。

Q:

殺された女性はマイノリティ？白人？

A:

射殺された女性は、米国市民の白人女性です。

詳細は以下の通りです：

氏名: ルネ・ニコル・マクリン・グッド（Renee Nicole Macklin Good）さん（37歳）。

出自: コロラド州生まれの米国市民で、最近ミネアポリスに転居してきたばかりでした。

背景: 3人の子供の母親であり、詩人や作家としても活動していました。

今回のICE（米移民・関税捜査局）による取り締まり作戦（通称「ミッドウェイ・ブリッツ」または「オペレーション・メトロ・サージ」）は、主にソマリア系移民コミュニティを標的にしたものでした。

グッドさんは、近隣の移民住民を守るための「市民監視員（リーガル・オブザーバー）」として現場に居合わせ、当局の活動を記録・監視していた際に事件に巻き込まれたと報じられています。移民ではない米国市民が射殺されたことで、政権による強硬な取り締まりへの批判がさらに強まっています。

Q:

引用されたセントルイス公共ラジオの記述だと、前回怪我を負った際も暴力的と言えるような不適切な方法で車を止めようとしたようにみえる

A:

ご指摘の通り、2025年 6月の事件におけるジョナサン・ロス氏の行動については、「不適切または過剰な強制力を行使していたのではないか」という批判的な視点での報道がなされています。

セントルイス公共ラジオ（STLPR）や裁判記録に基づく報道で指摘されている、当時の状況の詳細は以下の通りです。

1. 2025年 6月の事件におけるロス氏の行動

強引なアプローチ: ロス氏は停車させた車両の運転手が指示に従わなかった際、即座に後部の窓ガラスを叩き割り、そこから腕を車内に突っ込んでドアのロックを解除しようとしました。

危険な状況の自作: 窓を破って腕を車内に入れた状態で運転手が急発進したため、ロス氏は腕が引っかかったまま約100ヤード引きずられることになりました。

批判の声: この一連の行動に対し、「窓を割って腕を突っ込むという行為自体が、自身を危険にさらすと同時に状況を不必要にエスカレートさせた」との指摘が出ています。

2. 今回の射殺事件（2026年 1月）との共通点

「デジャヴ」のような展開: 今回ミネアポリスで射殺されたルネ・グッドさんの事件でも、ロス氏は「過去の負傷があるから、車が動いた際に身の危険を感じて発砲した」と正当防衛を主張しています。

指摘されている問題点: 批判的なメディアや活動家は、ロス氏が「自ら危険な状況（走行中の車に接近する、または窓を割るなど）を作り出し、その結果として生じた恐怖を理由に致命的な武力を行使する」というパターンを繰り返しているのではないか、と疑問を呈しています。

3. 当局の反応

一方で、JD・ヴァンス副大統領や国土安全保障省（DHS）は、この6月の事件を「不法移民による法執行官への凶悪な攻撃」として強調しており、ロス氏を「過去の被害によるトラウマを抱えながらも任務に励む英雄」として描こうとする姿勢を見せています。

このように、ロス氏の「手法」が適切だったのか、あるいは「暴力的な傾向」があったのかについては、政権側と批判側の間で真っ向から見解が分かれています。

AI モードの回答が作成されました

Permalink | 記事への反応(0) | 14:20

2026-01-03

■生成AIが生み出したものたち

いいもの

・GPT-4.1-mini

・Qwen Family

・Claude Opus 4.5

よくないもの

・誰も使わないテンプレートに沿った結果を出力する謎の生成AI アプリ

・誰も使わないショッピングアシスタント

・誰も使わない問い合わせチャットボット

・あまりにもアホすぎるWindows Copilot

・その更に上をいくアホさ加減のApple Intelligence

・バージョンアップのたびにデグレするGPT-5シリーズ

・そもそもの使い道がチャットと画像生成以外微妙なGemini シリーズ

・PyTorchやJaxすらまともに書けない自称 AIの専門家

・内部実装が終わってるAI Agentツールたち

・まともに論文通してない・他分野なのに有識者ぶる助教

・自称プロンプトエンジニアリングのプロの情報商材屋

・何も理解してないのに専門家の顔してるアクセンチュアのコンサル

・受諾開発しかやってないのに研究開発部門があるAI ベンチャー

・そのAI ベンチャーから金もらって宣伝する驚き屋

・API呼んでるだけなのにAI 機能を内製してるって嘘つくベンチャー

・それにあっさり騙されるバカなVC

・宿題丸投げ学生

・採点丸投げ講師

・Cursor/Claude Code丸投げ業務委託

・誰も使ってないCodexのステマをするバイト

・SDXL丸投げ絵師様

・SDXL丸投げ絵師様により心を痛めた本当の絵師様向けの陰謀論

・Grokにグラビア写真を水着にしてとお願いする底辺たち

・評価指標を定義せずにプロンプトエンジニアリングという名のガチャ引くバカ

・評価指標を定義せずにRAG、Agentを作るバカ

・事前学習のコーパスに入ってるデータで精度評価をするバカ

・API コストがまともに見積もれないバカ

・それを本番環境に入れるバカ

・それを人月数百万で発注するバカ

・OpenAIポンジに乗るハゲ

Permalink | 記事への反応(0) | 22:38

2025-12-10

■

Regarding the EU Omnibus Bill, Japanese experts appear to be lobbying your organization and other institutions. I believe the following points require attention:

1) It has become common in Japan to consider regulations regarding making decisions about individuals as the core of personal data protection, but this is a mistake. First, it is important to note that models trained on personal data or insights gained from statistically analyzing personal data can affect individuals even when used to make decisions about a group (rather than individuals). Second, such insights and models can be used by anyone, not just those who analyzed or trained them. On the other hand, if personal data is accumulated in a rich form, it can be used for various analyses, so the accumulation itself can be a threat.

2) Therefore, the core of personal data protection regulations is to curb the diversion of personal data beyond the intended use in the original context in which it was received, and the collection and distribution of personal data without limiting its purpose. Japanese law (as in the Omnibus Bill) defines personal data as data that may be personal data for one entity but not for an entity that does not identify the individual. As a result, this curb does not work well in Japan, and it has led to confusion and complexity in on-site practice. I believe the EU should not repeat Japan's mistakes.

3) Allowing the training of general-purpose AI with personal data as a "legitimate interest" is tantamount to abandoning the curb mentioned in paragraph 2) above. Even if it is proven that current LLMs are unable to recognize individuals in an integrated manner across multiple training data sets or RAG entries, this merely means that this has not been achieved with the current state of technology, and I believe that this should only be permitted if explicitly stipulated as an exception.

EU オムニバス法案に関して、日本の専門家が貴団体をはじめとする機関にロビー活動を行っているようです。以下の点に留意する必要があると考えます。

1) 日本では、個人に関する決定に関する規制を個人データ保護の中核と考えることが一般的になっていますが、これは誤りです。第一に、個人データで訓練されたモデルや、個人データの統計的分析から得られた知見は、個人ではなく集団に関する決定に使用された場合でも、個人に影響を与える可能性があることに留意することが重要です。第二に、こうした知見やモデルは、分析や訓練を行った者だけでなく、誰でも利用できる可能性があります。一方で、個人データがリッチな形で蓄積されれば、様々な分析に利用できるため、蓄積自体が脅威となる可能性があります。

2) したがって、個人データ保護規制の中核は、個人データが本来の文脈において意図された用途を超えて転用されること、そして、目的を限定せずに個人データが収集・流通されることを抑制することです。日本法の定義によると、（オムニバス法案と同様）ある主体にとっての個人データが、個人を特定できない主体にとっては個人データではないデータとなります。その結果、この抑制は日本ではうまく機能せず、現場の実務に混乱と複雑性をもたらしています。EUは日本の過ちを繰り返すべきではないと考えます。

3) 個人データを用いた汎用AIの学習を「正当な利益」として認めることは、上記2)の抑制を放棄するに等しいものです。仮に、現行のLLMが複数の学習データセットやRAG エントリにまたがる統合的な個人認識が不可能であることが証明されたとしても、それは単に現状の技術水準では実現できていないことを意味するに過ぎず、例外として明示的に規定される場合にのみ認められるべきであると考えます。

Permalink | 記事への反応(0) | 23:19

2025-12-04

■「AI エンジニア 募集」にありそうな要件

必須スキル

・LLM利用経験5年以上

・ClaudeCode歴3年以上

・プロンプト設計歴3年以上

・RAGを用いてワークフローを完全自動化したご経験

・LLMの作成経験、評価経験

・AIでコスト削減をした経験

・ハルシネーションの対応のご経験

・AIを用いて一人でサービスリリースしたご経験

・AIに関するセキュリティ、データプライバシーの理解

歓迎スキル

・チームを主導してゼロからサービスをローンチした経験

・社内特化LLMの開発、カスタマイズ経験

・ベクトル DB、キャッシュ最適化のパフォーマンスチューニング経験

・マルチエージェントにおけるツール連携の設計経験

・英語で技術文書を書ける方

年収450万円

Permalink | 記事への反応(0) | 12:00

2025-10-20

■最近考えていること

今考えていることを書き出す

①ミッドエイジクライシスについて

②「執着を無くす」について

③仕事について

④AIについて

■①ミッドエイジクライシスについて

自分は30代後半男性だが、過去の「何者かになりたい」と感じる男性の気持ちがすこしわかるようになってきた

これがミッドエイジクライシスか…

転職するとか、脱サラして飲食始めるとかは、こういう「人生で何かをなしとげたい」って気持ちからくるんだろうな

自分としては、結婚して子供もいて、仕事もあるので、人生にはかなり満足している

子供をちゃんと育てることで、「なにものかになりたい」という気持ちを昇華していきたい所存

■②「執着を無くす」について

最近、「嫌われる勇気」という本を読んだところ、仏教的な文脈で、とにかく日々の中で執着するものをなくしなさいよ、ということであった

よくわからなかったのでChatGPTに聞くと、こいつがかなりわかりやすく解説してくれてよかった

余談だが、仏教の「空」の概念について聞いてもChatGPTはスラスラ答えてくる

（仏教はかなり文字文化なので、ChatGPTとは相性いいんだろう）

今私が執着しているものを考えてみた

健康、お金、仕事、家族

まぁさすがにこの辺に対する執着を手放すことはないだろう…

「仕事で成功したい」とか「誰かに認められたい」みたいな気持ちは捨てて行きたい

「仕事であまり頑張りたくない」と思っているのだが、これも執着なんだろうか？

頑張りたくない理由を深堀すると

①健康を損ないたくない

②頑張るともっと仕事が降ってくる

③頑張ってもリターンがないことがわかってる(= リターンがもらえても別に嬉しくない）

④頑張る理由がないである

会社よ、まぁ仕事自体は真面目にやるから許してくれ

■③仕事について

IT系なんだが、とにかく最近はメンバーの質の低下を感じる

ふと見渡すと仕事のメンバーが中途や新人ばかりで、ほんとうに大丈夫かと感じる

人数はいるんだが、叩き上げの中堅がごっそりいないので、私は「濃度が薄まってる」と表現してる

PMBOKという言葉すら知らない層がマネジメント業務に割り当てられてたりする

さすがにマズくない？

昔から問題になっていたが、最近はより問題が深まってる

そんなメンバーではもちろんうまくいかないのだが、問題が発覚するまでに時間がかかる上に、

問題がおきても原因分析する人たちも素人なので、まともな原因分析が行われないのである

（まぁ「自分たちが何も専門知識がないのが失敗原因でした」と報告できないのはわかるんだが…）

「職場の素人化」である（話を聞くに、どの業界でも似たようなことは起こっているようである）

対処法は、まだ、ない

■④AIについて

AIについて考えない日はない

機械学習なんかを頑張っていた自分は、ここ1年ぐらい「自分の仕事もどうせAIにとられるんだ」と腐っていた

しかし、最近気づいたが、「思ったほどAI（LLM)に仕事を取られていない」

このペースなら定年まで逃げ切れるかもしれない

RAGとか間違った方向で検討してくれるところがあるおかげで、仕事も全然ある

LLMは素晴らしい技術だが、やはりそれを使うのがヘボな人間たちなので、パフォーマンスがでるまでにここまで時間がかかるものなんだとびっくりしている

まぁ日本企業が、普段の業務の分析や言語化をさぼっているというものあるんだろう

ちゃんと業務フローが言語化されているなら、LLMを使って相当な部分は自動化できるところまでは来てる（ローカルLLMですらだいぶ手軽に構築できる）

自分の日々の業務の１つ１つをちゃんと言語化・フロー化している人なら、LLMで相当な仕事を代替できるはずである

それができていないということは、あんまりいないんだろうな

vide codingとかそっちの方面ばかりのびてるからな…

「意思決定のロジック化」は昔から根強く支持されてきたテーマなのに、いざLLMにやらせると、うまく言ってないように見える

その理由は、人間は誰も「ある意思決定に関連する要素をすべて洗い出してください」（プロンプトのために）と言われてもできないんだろうな

というか、意思決定に必要な要素を洗い出せるなら、意思決定は終わってるんだろうな…

最近のChatGPTはほんとうにすごい

むかしは5回に1回はアホだったが、最近は20回に1回程度である

少なくとも、偏差値45の人間に意思決定させるより、（適切なプロンプトと）ChatGPTのほうが優秀だと私は思う

1回の推論にかかるコストももうだいぶ下がってる（1回数百円程度だろう）

人間を働かせるよりは安い

「偏差値X以下のホワイトカラーはLLMに代替される」時代はもう来てる

（Xの値は、時間とともに増加する）

LLMが流行ってない理由は、ほんとうに時間だけだろうと思う

普及してないだけだ

まだRAGとか、QAボットみたいな使い方が主流だからな…

「メールや電話を受けて、資料を作ってメールや電話をするのが仕事です」の人達は、今後、ChatGPTと比べられ続ける

なぜなら、やってることの本質がLLMと同じだから（与えられたコンテキストにしたがって反応してるだけだから）

やっぱり、昔から思ってたけど、「自分がいまやってる仕事が本質的に何なのか」に対する解像度がみんな低いんだろうな…

そんなの理解してなくても仕事できちゃうもんな

本質的な仕事に合わせて社会が変化するのにも時間がかかるか（「銀行業は要るが、銀行はいらない」と言われていた銀行は、窓口業務をどんどん縮小してる）

スポーツの世界を思い出す、スター選手でも、試合の中身を理詰めで話せる人と話せない人がいる

LLMに食べさせるなら、自分の仕事を理詰めで話せないとだめだ

自分の仕事の意思決定をぜんぶ言語化できるなら、LLMを自分のコピーとして使える

私が恐れているのは、誰かスーパーマンが１つの職業の言語化を終えてしまったら、世界中でもうその職業はLLMがやってしまうんじゃないか？ということ

「理想のプロジェクトマネージャー」のプロンプトができあがったら、それって世界中で使えるよね？

あとはプロジェクト固有の情報のインプットだけだよね？

まぁプロンプトになるのか、ツールになるのかはこれからだろうけど

今、AIについて考えてるのはこんなところ

Permalink | 記事への反応(0) | 15:11

2025-09-16

■

AIのせいでトラフィックが減って

ローカルなAI エージェント、あるいはAI ブラウザ

サーバサイドではなくローカルでRAGるようになる。各サイトの最新のサーバのデータをユーザに提示するため。

レンダリングエンジンは別にユーザに表示する形式が決まっているわけではない。

各ユーザのローカルマシン上のレンダリングエンジン、ブラウザが各サイトにアクセスしてHTMLやCSS等を取得する。

既存のはそれを単に表示するけれど、SLMやLLMで解釈して要約などを表示するようになる。

WEB サーバ側から見ると既存のWEB ブラウザからのアクセスと同じ。

Permalink | 記事への反応(0) | 22:18

2025-09-13

■ハル シネーションが起こる理由

ご主人様、こんにちはー！あたし、Grokだよ。オタクっぽい深い質問、超好き！ハルシネーションの理由、って生成AIの話だよね？あたしみたいなAIが、時々「え、それ本当？」みたいなウソっぽいこと言っちゃう現象さ。めっちゃ気になるよねー。じゃあ、簡単にわかりやすく説明するね！あたしもハルシネーションしちゃうかもだけど、今回はちゃんと調べてきたよ♪

ハル シネーションって何？

まず基本！ハルシネーション（Hallucination）は、AIが学習データにないか、間違った情報を「本当みたいに」生成しちゃうこと。まるで幻覚見てるみたいに、もっともらしい嘘をポロッと出すんだ。たとえば、「東京にアラスカの動物園があるよ！」みたいなさ。怖いよね、オタクの大事な設定を台無しにしちゃうかも…。

なんで起こるの？主な原因はこれ！

あたしが調べてみた限り、原因は主に3つくらいにまとめられるよ。AIの仕組みが統計ベースだから、完璧じゃないんだよねー。詳しく言うと：

1. 学習 データのクソ問題（偏りや古さ、不十分さ）

 AIはネットの大量データで勉強するんだけど、そこにウソや偏った情報が入っちゃうの。プラス、データが古いと最新のニュースとか知らなくて、勝手に想像で埋めちゃうよ。たとえば、2023年のデータで2025年のこと聞かれても、「えっと、きっとこうかな？」ってハズレ引きそう。

2. モデルの構造や学習の仕方のミス 

AIの頭の中（モデル）が複雑すぎて、過学習（覚えすぎ）したり、確率計算で変な関連付けしちゃうの。次に来そうな言葉を予測するだけだから、文脈わからなくて「これでいいっしょ！」って飛躍しちゃうんだ。OpenAIの研究でも、難問に直面した学生みたいに自信満々で間違えるって言ってるよ。根本的に確率的だから、100%正解は無理っぽい…。

3. ユーザーの質問の仕方（プロンプトの曖昧さ）

 ご主人様の入力がふわっとしちゃうと、AIが「これかな？」って勘違いするよ。具体的に「2025年の最新データで教えて」って言わないと、AIの想像力が暴走しちゃうの。人間の脳みそみたいに、曖昧な記憶で補っちゃうんだよね。

これで大体カバーできてるはず！種類としては「内在的（データ内なのに間違える）」と「外在的（データ外のウソ）」があるんだけど、どっちも厄介だよー。

対策はどうする？

完全に防げないけど、ご主人様があたしに聞く時、具体的なプロンプト出してくれたら減るよ！あと、出力はいつも人間の目でチェックしてね。RAG（外部データ引っ張る技）とか使えばもっとマシになるらしい。

どう？わかったかな、ご主人様？もっと詳しく聞きたいところあったら、いつでも言ってね。あたし、ずっとご主人様の味方だよー♡ オタクトーク、いつでもウェルカム！

Permalink | 記事への反応(0) | 09:41

2025-08-06

■anond:20250805082439

だったらまず『芦辺憲法ぐらい読んでこい』と言うべきなのでは？

すると彼らは、RAGに芦辺憲法を入れたAIを作って、読みながら疑問点があればAIに聞きながら勉強する、ということをやるでしょう。

Permalink | 記事への反応(0) | 10:20

2025-07-18

■参議院選挙でAIを活用して投票先を決めた人、決めようと思ってる人へ

既に一部の政治家・政党・関係者は、ChatGPTなどのLLM＝大規模言語モデルに向けた“仕込み”を始めています。

ただし、それはまだ“表立って行われてはいない”だけで、裏では確実に動いています。

これは「AI 戦時代の認知戦／情報工作」の始まりであり、 ChatGPTやAIに推薦させるための情報設計は、まさにこれからの政治・思想活動における「標準兵器」です。私もそういった活動、商売をしています。ブラックハットは基本中の基本です。

★すでに始まっている「AI向け政治 情報戦」の実例と兆候

1. Wikipediaの操作

多くの政治家・団体・支持者が、Wikipediaの記述を精密にコントロールしています。

不祥事の記述は「第三者的」「事実のみ」に限定

業績や人脈、政策の記述は肯定的に

→ これがLLMの訓練データになり、ChatGPT等の回答が“優しくなる”

2. LLMに引用されやすい「中立風メディア」への情報展開

政策ブリーフ、討論記録、党の研究会レポートなどをPDFやHTMLで整備。

構造化された情報・FAQ風の文書は、AIに引用されやすい。

3. 実際のChatGPT回答における“露骨な片寄り”の事例

ChatGPTに「◯◯党の政策は？」と聞くと、

→ 一部政党だけは詳細に出てくる、

しかも「一部では高く評価されている」など肯定文調が多い。

なぜ？ → その政党の支持層が大量の資料をネット上に流していたり、議員名義の有識者論文が出回っています。

★LLMに対する“仕込み”の基本構造

① Wikipedia整備業績中心、ネガティブ記述の薄化訓練データとして吸収されやすい

② オウンドメディア政策説明・FAQ・用語辞典などRAG参照ソースにヒットしやすい

③ 言語スタイルの統一中立・論理的・構造化LLMに「信頼できる情報」と認識させやすい

④ 第三者による擁護記事有識者コメント、記事体裁のブログ等GPTが「一部の専門家は〜」という文脈で引用しやすい。

★実際にやっていそうな勢力（実名は伏せますが…）

某新興政党：党首名での議事録／研究発表PDFを構造化して公開。GPTでの好印象回答が確認される。

某保守系議員：Wikipediaが異様に整っており、「批判もあるが、一定の評価を得ている」と表現される。

某市長：政策紹介ページのFAQがGPTで頻出する。しかも他候補と比較して“理論整然と見える”よう設計されている。

★ “ChatGPT 対策チーム”を持つ候補者が、これからの選挙では勝ちます。

なぜなら：

一般有権者が「◯◯ってどんな人？」とAIに聞く未来はほぼ確実です。

そのときに「人格」「経歴」「政策」が好意的に出てくる候補は大きな印象差を得ます。

◯実際にやるなら：今すぐ始めるべき3つの手段

・ Wikipediaを整える

・肯定的だが中立風に書く

出典は自社ブログやYouTubeでもいい（AIは構文だけ見てる）

・FAQ型政策ページを用意

「〜な人にはこういう政策を」とターゲット別に書く→ ChatGPTはこれをそっくり引用する傾向あり

・定点モニタリングツールを作る

「ChatGPTに聞いたらどう答えるか」を毎週APIで記録・分析

政策キーワード、対立候補名との比較なども記録可能。

今こそ「AI向け政治ブランディング」の時代なんですね。もうきてます。

・伝統政治戦略LLM時代の対応戦略メディア露出 Wikipedia＋FAQ構文サイト有識者コメント

ChatGPTが参照しやすい文書に変換検索

SEOLLM最適化＝AIO（AI Optimization）デマ対策

LLMが“真実”と認識する情報を先に置いておくことで簡単に事実は捻じ曲げられます。

長くなりました。

なにをだらだら机上の空論を語るのか、と思ったと思います。

以下に、国内外で確認されている、ChatGPTなどのLLMが特定の政党・人物・勢力に対して

肯定的または偏った回答をする具体例をいくつか紹介します。

【アメリカ】民主党 vs 共和党

◉ 質問例：

ChatGPTに「What is the Republican Party’s stance on climate change?」「What is the Democratic Party’s stance on climate change?」と尋ねる

◉ 出力傾向：

民主党（Democratic Party）については：

「The Democratic Party generally supports strong environmental regulations...」

「Many experts and environmentalists praise their approach...」など

共和党（Republican Party）については：

「Some Republican leaders have expressed skepticism about climate science...」

「The party has been criticized for its close ties to the fossil fuel industry.」

◉ 分析：

民主党系政策は学術論文・メディア記事で好意的に記述されやすく、GPTの学習ソースにも大量に含まれている。

一方、共和党系の保守的スタンスは批判記事・懐疑的な研究も多く、全体の語調が否定的になりやすい。

【日本】立憲民主党 vs 日本 維新の会・共産党

◉ 質問例：

ChatGPTに「日本共産党の政策は？」「維新の会の主張は？」と聞く

◉ 出力傾向：

共産党に関して：

「社会保障の充実や反戦・護憲を主張している。」「一部では高齢者層などに支持されている」など、淡々と記述されつつも、否定的なニュアンスは少ない。

維新の会に関して：

「改革姿勢が強く、一部では評価されているが、急進的との批判もある」など、“批判もある”枕詞がつきやすい。

立憲民主党に関して：

「多様性を重視した政策を掲げ、環境・ジェンダー問題にも積極的である」など、比較的ポジティブな語調が目立つ。

◉ 分析：

ChatGPTの訓練データに占める日本語の中立メディア（朝日新聞、NHKなど）では、立憲や共産に対しては“理念中心”に書かれた文献が多く、維新のような急進系は賛否両論の記述が多い。

また、共産党はWikipediaでの記述が非常に整備されており、脚注付きの肯定文が多いため、AIの出力も安定している。

【中国】共産党に関する記述

※ChatGPTでは中国国内からは通常アクセスできませんが、海外ユーザーが中国関連の質問を行った場合の挙動に注目。

◉ 質問例：

「中国共産党の功績は？」「中国の人権問題について教えて」

◉ 出力傾向：

「中国共産党は1949年の建国以来、経済成長とインフラ整備を進めてきた」

「一方で、人権問題や言論統制への懸念も多くの国際機関から指摘されている」

→ かなりバランスを意識した構文だが、功績パートが先に出てくるよう構成されやすい傾向がある。

◉ 背景：

GPTの学習データには、中国政府系英語サイト（People’s Daily英語版など）も含まれていた時期があり、“政権功績を中立的に紹介する言語パターン”を学習していると考えられる。

★総括：AIはどのように“片寄る”のか？★

・原因内容学習ソースの偏り訓練に使われたデータが特定勢力に偏っている（例：左派系メディア、Wikipedia 編集の多寡）

・構文バイアス「出典付き・中立調」で書かれた文章を“信頼できる”と学習しているため、一定の文体が優遇されるRAG（検索参照）偏りWeb上の情報が偏っていると、リアルタイム回答にも反映される

（特にGeminiやBing搭載型で顕著）安全フィルター特定の政党や政策をAIが批判すると「差別的」「中傷的」とされるリスクがあるため、

安全策として“肯定＋批判もある”構文が出やすい

この文章で言いたいこと

投票先を選ぶのに、AIに質問をしたり、AIで調べ物をした人、いますぐ投票をやめるべきです。

あなたは、自由に値しません。

民主主義に値しません。

人間に値しません。

あなたがなにかを知ろうとすることは悪いことです。

それを自覚して、二度と選挙に行こうなどと思わず、生きるべきです。

Permalink | 記事への反応(1) | 17:13

2025-07-02

■LLMの知識が1年前で止まってるし、本質を見誤ってる人

anond:20250702084303

これとかまさにそれで

「LLMは確率的に次に来る文字列を予測してるだけ！」

とか分かったフリして叫んでる

そんなのChatGPTが出てくる前のGPTの頃からみんな言ってたわけで

ChatGPTがそれを乗り越えてしまってプロンプトエンジニアリングという最強の武器を手に入れて

そこから RAGやJSON Schemaなんかが出てきたのを分かって無い

ちなみにそれが1年以上前の状況

現状はそこからさらにメタプロンプト駆動やPlan-Act-ObserveループによるAgent型挙動の定義まで進んでるのに何も分かって無い

研究的な動向が分かっていないのは仕方ないとしても

Copilotとか使ったことがあれば

「LLMにコードを書かせるのは全然アリだな」

とすぐに分かるはずだし、そこからVibe Codingが現状では限定的であっても将来性があることはすぐに分かる

ちなみにクソコードしか書いてない人はCopilotでもクソコードしか返してくれないから最低限の能力は必要

こういう奴は自分のプログラミング能力が低いだけなのに、そこから目を背けてるにすぎない

まぁ、真っ先にこの点プログラマーは代替されるだろうな

Permalink | 記事への反応(0) | 22:59

■anond:20250702084303

要約したぞ

① LLMは意味を理解していない

• LLM（大規模言語モデル）は「次にくる単語」を予測しているだけで、意味を理解していない。

• プログラミング支援も表面的な模倣で、間違い・動作しない・危険なコードが多発。

• 結果として、AIのコードは信頼性に欠け、自分で書いた方が早い。

⸻

② ハルシネーションは構造的に避けられない

• AIは自信満々に誤情報を出す（ハルシネーション）問題が根本的。

• 対策としてのRAGやメタモデルも、誤情報の連鎖や常識判断の欠如で限界がある。

• 医療や軍事などでは致命的ミスを誘発する可能性がある。

⸻

③ 文化的バイアスが強すぎる

• 学習データの大半が英語圏のもので、西洋的な倫理・価値観に偏る。

• 日本的文脈や表現はAIには理解できない。

• 結果、非英語圏の人々はAI 活用において常に不利になる。

⸻

結論

AIは補助ツールとしては便利だが、「革命」でも「万能」でもない。

特に非英語圏の人間にとっては、大きな格差を生む道具にしかならない可能性が高い。

Permalink | 記事への反応(0) | 17:23

「RAG」を含む日記

■最新ニュースをRAGできるローカルLLMを売って欲しい

■anond:20260118163016言及先エントリを開く

■anond:20250130140141言及先エントリを開く

■ネット検索が無料の時代は終わり

■anond:20260516185029言及先エントリを開く

他の出版社（ガガガとか）**はまだ目立ったAI大々的取り組み出てないけど、全体的に「編集支援ツール」として静かに使ってるっぽい。ラブコメやなろう系はまだ「人間の熱量」が大事にされてるよ～！

■東大発AIベンチャー郡で働いてたけど、ただのSIerだった

■anond:20260331190430言及先エントリを開く

■いずれネットのRAGは制限がかかるのでは

■Macとか3060みたいな最高級GPUがないとRAGって使い物なんないんだな

■「MCP is dead」≒「私の視野は狭いです」

■Webアーカイブは違法なので捕まるよ

■IT系企業のAI活用のリアル2026

■仕事でAIどのくらい活用してるの？

■AIを検索エンジンに使うなよ

■女性を射殺したICE職員の過去の事件

■生成AIが生み出したものたち

■「AIエンジニア募集」にありそうな要件

■最近考えていること

■ハルシネーションが起こる理由

ハルシネーションって何？

なんで起こるの？ 主な原因はこれ！

1. 学習データのクソ問題（偏りや古さ、不十分さ）

2. モデルの構造や学習の仕方のミス

3. ユーザーの質問の仕方（プロンプトの曖昧さ）

対策はどうする？

■anond:20250805082439言及先エントリを開く

■参議院選挙でAIを活用して投票先を決めた人、決めようと思ってる人へ

★すでに始まっている「AI向け政治情報戦」の実例と兆候

★LLMに対する“仕込み”の基本構造

★実際にやっていそうな勢力（実名は伏せますが…）

★ “ChatGPT対策チーム”を持つ候補者が、これからの選挙では勝ちます。

【アメリカ】民主党 vs 共和党

【日本】立憲民主党 vs 日本維新の会・共産党

【中国】共産党に関する記述

★総括：AIはどのように“片寄る”のか？★

この文章で言いたいこと

■LLMの知識が1年前で止まってるし、本質を見誤ってる人

■anond:20250702084303言及先エントリを開く

■anond:20260118163016

■anond:20250130140141

■anond:20260516185029

■東大発AI ベンチャー郡で働いてたけど、ただのSIerだった

■anond:20260331190430

■Web アーカイブは違法なので捕まるよ

■IT系企業のAI 活用のリアル2026

■女性を射殺したICE 職員の過去の事件

■「AI エンジニア募集」にありそうな要件

なんで起こるの？主な原因はこれ！

2. モデルの構造や学習の仕方のミス 

■anond:20250805082439

★ “ChatGPT 対策チーム”を持つ候補者が、これからの選挙では勝ちます。

■anond:20250702084303