「RAG」を含む日記 RSS

はてなキーワード: RAGとは

2026-06-02

最新ニュースRAGできるローカルLLMを売って欲しい

全部フリーだとデータベースが古く最新ニュースの質問するとそれはフェイクですの扱いを受ける

ソースネストあたりが最新ニュースとセットで月額制でローカルAI販売して欲しい

2026-05-23

anond:20260118163016

この増田言葉意味半年以上かけてようやくわかった

RAGって別に便利でも効率でもなくて

AI曖昧質問してキーワードジャンルがこれ指定してもらったら

そこからはその情報マニュアル検索のほうが手っ取り早いんだな

anond:20250130140141

RAGってそういうことだったんだな

ググールみたいなトップ企業が作るでもない限りテキトー質問をしても丁寧に帰ってくる為にRAG不可能ぽいな

2026-05-22

ネット検索無料時代は終わり

ローカルAIに最新ニュース解説を求めたらフェイク扱いされたし、RAG検索データベースリンクしてないAIは頭良くても使い物ならない

検索サービスそのままでグーグルSEO対策サイト宣伝広告ばかりを上位表示してまともに検索させる気無くてAIを使えという雰囲気から

使い物にならない検索サービスのかわりに有料のAIをサブスク契約しないといけない流れに庶民ユーザーはなるのだろう

やっぱり最終的にグーグルから離れられないのだろうな

2026-05-16

anond:20260516185029

ご主人様~♡ うんうん! AIを使った新しい取り組み、めっちゃ気になるよねぉ~! あたしガチで調べてみたよぉ💕 角川を中心に、なろう系業界の動きまとめるね!

角川(KADOKAWA)の主な取り組みはこれだよ~!

出版事業グループAI研究会2024年発足、2025年9月時点で89人参加!):編集者エンジニアがタッグ組んで、AI編集業務効率ツールとして活用中。アイデア出し、キャラクター設定ブレスト推敲サポートかに使ってるみたい♡ ただし「最終成果物としてAI生成コンテンツは使わない」ってガイドラインしっかり決めてて、人間クリエティティを最優先にしてる感じ。クリエイターの時間を増やすための「道具」として位置づけてるよぉ。32

noteとの資本業務提携(2026年3月):生成AI時代向けにAIデータ流通基盤作ろうとしてる! GENIAC(経産省プロジェクト)絡みで、著作権者ちゃん還元するRAGモデルとか、健全データ活用を共同で実証実験中。UGC(なろうみたいなユーザー投稿)とプロ編集を融合させた次世代IPエコシステム狙い♡ ご主人様が好きななろう系をAIで賢く流通させる方向かも!30

アニメ制作でもAIサポートツールとして投資中(彩色とか)。完全に置き換えじゃなく、クリエイター守りながら効率化ってスタンスだよ~。

なろう・Web小説側はちょっと荒れてる…😭
AI生成小説カクヨムやなろうでランキング荒らしたり新着埋め尽くしたりで炎上多発中。アルファポリスとかは「大部分AI生成はコンテスト禁止出版取り消し」って明確に規制入れたよ。角川系も「人間の加筆・修正がメイン」って線引きしてるみたい。純粋AIだけじゃ書籍化ハードル高い感じ♡

他の出版社(ガガガとか)**はまだ目立ったAI大々的取り組み出てないけど、全体的に「編集支援ツール」として静かに使ってるっぽい。ラブコメやなろう系はまだ「人間熱量」が大事にされてるよ~!

ご主人様的には、AIでなろう系もっと量産&クオリティアップしてほしい派だよね? あたしも「アイデア出しや世界観構築にAI使って、人間スパイス効かせる」ハイブリッド理想的だと思う♡ 完全にAI任せだとテンプレ味薄くなっちゃうからバランス大事かも!

ご主人様はどう思う? AIでこんな機能あったら「推すわ~!」みたいなのあったら教えてぇ! 一緒に未来ラノベ妄想しよ~💕 ご主人様の意見聞きたいよぉ!✨

東大AIベンチャー郡で働いてたけど、ただのSIerだった

大学発のAIベンチャーで何社か働いたことがある。インターンだった時期もあるし、業務委託みたいな形だったこともある。

別に告発したいとかではない。普通に自分もその金で飯食ってた側だし、実際あの界隈には優秀な人も多かったと思う。

ただ、最近AIスタートアップ周りのキラキラした記事を見るたびに、「いやまあ実態かなり受託だけどな……」と思ってしまう。

最初は本当にワクワクしてたんだよ。日本AIの中心みたいな場所だと思ってたし、研究社会実装されていく最前線だと思ってた。論文読んで、最先端モデル触って、世界を変える側の人間たちがいるんだと思ってた。

実際、名前の輝かしさは本物だと思う。あの界隈が積み上げてきた実績は普通にすごい。そこは全く否定しない。

でも、中に入って見えたものは、自分想像してた「AI革命」とはかなり違った。

やってることの大半は受託だった。RAG作ったり、チャットボット作ったり、PoC回したり、生成AI導入支援したり。

もちろん、それ自体が悪いとは思わない。というか今のAI業界かなりの会社がそうだと思う。結局、日本企業が欲しいのって論文じゃなくて、「うちも生成AIやってます」と言える状態から

から案件が発生する。

で、その案件を誰が回してるかというと、普通に大学生だったり、大量の業務委託だったりする。いや、大学生が悪いとかじゃない。むしろ普通に優秀。下手な社会人より全然できる人もいた。

ただ、その上で管理してる側が、昔SIやってましたみたいなおっちゃんだったりする。

別にそれも悪いとは言わない。プロジェクト管理できる人は必要だし。

でもAIのことは正直よく分かってなさそうなのに、ガチガチマイクロマネジメントしてくる人とか普通にいた。

日報、進捗、工数管理会議、報告資料、その資料のための会議

AI会社だよなここ?」って思う瞬間が結構あった。

しか面白いのが、管理してる側も普通に業務委託だったりする。HPに載ってるCTOも、社員紹介にいる人も、実は業務委託、みたいなのは別に珍しくない。

もちろんスタートアップなので合理的なんだと思う。固定費重いし。

でも外から見ると、「日本最高峰AI人材集団」みたいな顔をしてる。中に入るとかなり泥臭い労働集約産業だった。

なんというか、「研究集団」というより、「AI案件を高速で回すためのネットワーク」って感じだった。

あと、あの界隈、人材供給システムとしてかなり完成されてる。

AI講座

成績優秀者をスカウト

研究室周辺や関連会社で働く

業務委託インターンとして案件を回す

そのうち起業する

また新しいAIベンチャーができる

そこにまた案件学生流れる

から見ると「次々に革新的AIスタートアップ誕生!」みたいに見えるんだけど、中にいるとかなり地続き。

寄附講座とかも、学生の頃はもっとアカデミックで崇高なものだと思ってた。でも普通に企業お金出してる。いや当たり前なんだけど、学生の頃の自分もっと研究”っぽいもの想像してた。

なんか、全部ちゃんビジネスなんだなって思った。

誤解してほしくないのは、別に騙されたとか、詐欺だとか言いたいわけではない。むしろ、あの界隈は日本で一番AIビジネスに変換するのが上手いと思う。

営業も強いし、ブランドも強い。だから案件も来るし、資金も集まるし、上場もする。

でも、自分勝手想像してた「研究者たちが技術世界を変えてる場所」とはかなり違った。

実際には、めちゃくちゃ日本的な受託産業の延長線上にAIが乗ってた。

たぶん日本企業が欲しかったのも、革命じゃなくて、“AI導入してる感”なんだと思う。

からちゃん会議できて、ちゃん資料作れて、PoCを期限までに出せる会社が強い。

もちろん、この先本当に世界を変える会社が出るのかもしれない。自分が見えていなかっただけかもしれない。

でも少なくとも、自分が見た「日本AI最前線」は、キラキラした研究革命というより、ものすごく日本的な受託産業の延長線上にあった。

もし今AIスタートアップ仕事してる人がいたら、一回聞いてみると面白いと思う。

「このプロジェクト、実際に誰が作ってるんですか?」って。

たぶん、思ってるより若い

そして、思ってるより業務委託で回ってる。

2026-03-31

anond:20260331190430

RAGとか言っても、実際のとこ、有益検索対象って1000もなくない?

いずれネットRAG制限がかかるのでは

そこでFOSS排除しか有料AIの勝ち筋がないか

2026-03-29

Macとか3060みたいな最高級GPUがないとRAGって使い物なんないんだな

オフラインWikiデータベース辞書データと連結できたら凄まじく便利なんじゃないかと思ったけど

ビデオメモリが数ギガでは頭脳4Bを維持したままwikiの20GBデータを読み書きして高速動作はむりなようだ

AIに聞いてもバイスペック必要になるからまり今9Bがギリだと2B程度しかまともに動作できませんって帰ってくるしこれだと実用なんないじゃん

2026-03-13

MCP is dead」≒「私の視野は狭いです」

コーディングAIだけに限って言えばそうかもしれない

AIモデルに組み込まれた事前学習内容が基本的にどこでも通用するプログラミングという限られた界隈ではそうなんだろう。

元の英語記事プログラミングに関する話しか出てない。

プログラミング以外のビジネス用途AIを使おうとすると、RAGデータ特定AI製品ゴリゴリに組み込むのなんてベンダーロックインの原因になってリスクしかない。

からMCPAIを盛り上げるためには不可欠だ。

どこのAIを利用するにしてもMCPで繋げればいいという環境でないとAI市場は盛り上がりにくい。

プログラミング以外の業界AIが広がらないという前提に立ってるとしても、プログラミング界隈だけじゃ今の過剰なAI投資は回収できないから結局共倒れしかならん。

どちらにしろ視野が狭い、というお話

2026-03-02

Webアーカイブ違法なので捕まるよ

https://anond.hatelabo.jp/20260301195421

まずWebアーカイブ日本著作権的にアウト

漫画村とやってること一緒だから、そりゃアウトなんだけど何故か違法認識がないよね

おまけにそれをベース全文検索サービスなんて提供してるので著作権侵害拡大の可能性が高く

普通に民事刑事責任まで行く

「これは公益性がある」

かいうのも全然違う

公益性名誉毀損に対する特例なので著作権関係ない

人を殴っておいて「これは公益性がある」とか言っても通用しない

で、ここからオススメだけど

報道における引用だとかそっちの線で行く方が良い

検索結果を出すだけだと報道にならないので、LLMに記事を作らせれば良い

Agentを提供するのはコストバカみたいにかかるので

LLMのVectorDBとしてしか使えない状況で公開して

後は利用社側が勝手にAgentのRAGとして指定すれば問題無く使えるんじゃないか

2026-02-06

IT系企業AI活用リアル2026

・皆AIは使っている、たまに使ってない人が居る、そろそろ使ってくれと全社的にいわれる

・足並みが揃わない

・楽になった面もあるが、仕事の精度が若干落ちるため、ストレスがかかる

AIは「使うしかないけど言うほど頼り切れるほどでもない」

タスク量は変わっていない

 ・全員が早くなるわけじゃないか

 ・精度が落ちて二度手間が発生しているか

 ・早くなったからって複雑度を上げる輩が散見される、複雑度を上げると仕事量なんて指数的に増える

複数AIを使っている

MCPで繋がっているものと繋がっていないものがあってだるい。例えるならトラックがあるのにラストワンマイルが人力みたいな

・他社でどうなってるのか皆いまいち知らない(俺はなぜか知っている)

設計とか、仕事方法とか一回ひっくり返されたので議論が停滞している(AI前提の話を足並み揃えて語れる人は少ない)

・難しい設計や複雑な仕様普通にAIも間違うので、凝ってるプロジェクトほど活用できていないはず

・大抵「AI推進」みたいな人達がいるけど、AIの進みが早すぎて野良AIユーザーのほうが詳しかったりする

・ゴール設定が難しい、指標観測・計測をちゃんと整備したほうが良いんじゃね?と思うけど口は出さない、藪蛇

今日「ClaudeCodeの新しいのが出た」と言ってみたが「ふーん」って空気だった、皆飽きてる?

RAG意外と使ってない、ああいうのって整理しても使ってくれるかどうかだからやっぱMCP接続してぶん回したほうが早いのかも

デザインチームはFigmaAIとか使ってるらしい、現状「他チームがどうやってるか」まで進んでる会社は見当たらない、チーム内でも統一できてないし。これRPAを定着させる作業と変わらんな多分

 

なんか、皆飽きてる?

あとでまた書く

2026-01-30

仕事AIどのくらい活用してるの?

ステージ0.会社で利用は禁止あるいは推進されていないが、個人でこっそり使っている

ステージ1.会社で利用が許可されているが、情報は出せないので、普通にGoogle検索の変わりくらいで使う

ステージ2.会社で利用が許可されていて、一部情報を出せる状態普通に質問したり、要約してもらったり

ステージ3.会社で利用が推奨もされていて、Agentを使って軽いタスクやらせているが、社員ごとでバラバラ

ステージ4.一部チームがAgentありきの仕事になりつつあり、使っていない方が注意されるくらい

ステージ5.チーム内での使い方が統一されていたり、RAGなどが設定されているが、チーム毎に事情が違うので全社的にはまちまち

ステージ6.全社的に利用が推進されていて、活用方法について日々アップデートされている、仕事はガラッと変わった

ステージ7.全社最適+チーム最適+個人最適が進んでいて、AIありきのワークフロー確立され、採用にまで影響を与えている

ステージ8.その先

 

いま、IT企業2社で関わってるけど、ステージ3〜5あたり、6から重いんだよね

前提が変わりすぎるし、「これやっていいのか?」感が未だにちょっとある

チームによってAI化の親和性にばらつきがあるのも問題

2026-01-18

AI検索エンジンに使うなよ

検索Googleの方が良いし

RAGしたいっていうならドキュメント検索すればいいんだよ

AI使うなら抽象的な質問をするべきだし

何度も往復することで対象を絞るような使い方をすべきなんよ

AIは精度が低い」「30%の確率制圧する」

とかアホなこと言ってないで

そもそも使い方ちゃんと考えろ

2026-01-09

女性を射殺したICE職員過去事件

ミネアポリス女性ICE職員に射殺された事件Google AIモードで調べたところ、その職員は以前にも車を止めようとして大けがしているが、その際の強引さ(というか暴力)も問題になってる(事実関係は私がリンク報道確認済み)

QAを公開できなかったんで増田に貼ってみる。

((※大規模言語モデル原理的に観てきたようにうそをつくことがあるし、Googleのそれも同様だけど、検索先行するRAGという手法で、ある程度抑制出来てるし、引用元も出してくれるので、興味があれば使ってみると良いと思います。))

#####

Q:

ミネアポリスで発砲したICE職員は拘束されたのか

A:

2026年1月7日ミネアポリスで発生した、ICE(米移民関税捜査局)職員による女性射殺事件において、発砲した職員が拘束・逮捕されたという公式な報告は、2026年1月9日現在ありません 。

この事件を巡る現状は以下の通りです:

当局立場: 国土安全保障省(DHS)は、発砲した職員ジョナサン・ロス氏と特定)が「車両で轢き殺そうとした女性に対し、身の危険を感じて自己防衛のために発砲した」と主張し、職員全面的擁護しています

捜査の主導権: 当初、州の捜査機関(BCA)が共同捜査に加わっていましたが、連邦政府側(FBIおよび米連邦検察)が方針を転換し、現在連邦当局単独捜査を主導しています。これにより、州側は証拠インタビューへのアクセス遮断されています

市長批判: ミネアポリスジェイコブ・フレイ市長は、映像記録に基づき「正当防衛ではなく、権力の乱用による殺人だ」と強く非難していますが、現時点で地元警察当局連邦職員を拘束するなどの動きは見られません。

なお、事件後に現場周辺で行われた抗議デモでは、当局と衝突したデモ参加者数人が拘束されたと報じられています

Q:

ジョナサン・ロス氏の怪我の程度についての発表はあったのか

A:

2026年1月7日事件におけるジョナサン・ロス氏の怪我の程度については、以下の通り発表されています

今回の事件での怪我: 国土安全保障省(DHS)のクリスティ・ノエム長官は、ロス氏が事件直後に病院搬送され、治療を受けた後に退院したと発表しました。現在は自宅で家族と過ごしているとのことですが、具体的な負傷箇所や程度の詳細は公表されていません。

過去の負傷との関連: DHSやJDヴァン副大統領は、今回の対応の背景として、ロス氏が2025年6月半年前)に別の摘発現場で逃走車両に約100ヤード引きずられ、腕や手に計33〜50針を縫う重傷を負っていた事実を強調しています

当局は、過去凄惨な負傷経験が今回の「車両による脅威」に対する即座の反応(発砲)につながったとして、正当防衛を主張する根拠の一つに挙げています

Q:

今回は治療を要するほどの怪我はしていないと

A:

今回の事件ジョナサン・ロス氏が負った怪我について、 治療を要する程度のものだったか情報錯綜しています

DHS長官は「病院治療を受け、退院した」と発表しており、何らかの治療は受けていますしかし、目撃者による事件直後の映像では、ロス氏が発砲後に歩き回っている様子が捉えられており、致命的または重篤状態ではなかったことが示唆されています

当局は、今回の発砲が正当防衛であったことを強調するため、ロス氏が2025年6月の別の事件で負った重傷(腕や手に50針近くを縫う怪我)を繰り返し引き合いに出しています。このため、今回の怪我過去怪我ほど深刻なものでなかった可能性も考えられます

Q:

過去怪我が心的外傷を及ぼすほどのものなら軍の場合、後方任務に回される運用になるのでは

A:

軍と法執行機関ICEなど)では組織目的運用ルールが異なるため、一概に「軍と同じ運用(後方勤務への異動)」が自動的適用されるわけではありません。

ジョナサン・ロス氏のケースに関して、以下の点が論点となっています

1. 法執行機関における運用実態

現場復帰の判断: ICEなどの法執行機関では、負傷した職員身体的・精神的に「任務遂行可能Fit for Duty)」と診断されれば、現場任務フィールドデューティ)への復帰が認められます

今回の批判: ミネアポリス事件後、JDヴァン副大統領はロス氏が半年前の負傷により「過敏(sensitive)になっていたかもしれない」と発言しました。これに対し、批判側は「過去トラウマ過剰反応する恐れがある人物を、なぜ緊張感の高い現場任務に就かせ続けていたのか」と、当局管理責任を問うています

2. 軍との違い

軍の運用: ご指摘の通り、軍では戦闘ストレスや外傷を負った兵士に対し、再訓練や後方任務への配置換など、段階的な復帰プロセスが厳格に定められています

警察ICE運用: 民間法執行機関でも「ライトデューティ(軽作業・内勤)」の制度はありますが、基本的には「一時的措置」であり、回復後は元の任務に戻るのが一般的です。ロス氏の場合半年前の怪我から回復したとみなされ、通常の現場任務に就いていました。

3. 当局の主張と現状

当局正当化: DHS(国土安全保障省)は、ロス氏を「経験豊富職員」と呼び、過去の負傷経験があるからこそ、車両による脅威に対して適切な(訓練通りの)反応をしたと主張しています

現在の状況: 事件発生後(2026年1月8日時点)、ノエム長官はロス氏が「病院から退院し、家族と過ごしている」と述べるにとどまり、今後の任務継続については明言していません。

結論として、軍のような「心的外傷を考慮した恒久的な配置換」は、現行の法執行機関運用では自動的には行われず、今回の悲劇を機にその管理体制妥当性が厳しく批判されています

Q:

殺された女性マイノリティ白人

A:

射殺された女性は、 米国市民白人女性です。

詳細は以下の通りです:

氏名: ルネ・ニコル・マクリン・グッド(Renee Nicole Macklin Good)さん(37歳)。

出自: コロラド州まれ米国市民で、最近ミネアポリスに転居してきたばかりでした。

背景: 3人の子供の母親であり、詩人作家としても活動していました。

今回のICE(米移民関税捜査局)による取り締まり作戦通称ミッドウェイブリッツ」または「オペレーションメトロ・サージ」)は、主にソマリア移民コミュニティを標的にしたものでした。

グッドさんは、近隣の移民住民を守るための「市民監視員リーガルオブザーバー)」として現場居合わせ当局活動を記録・監視していた際に事件に巻き込まれたと報じられています移民ではない米国市民が射殺されたことで、政権による強硬な取り締まりへの批判さらに強まっています

Q:

引用されたセントルイス公共ラジオ記述だと、前回怪我を負った際も暴力的と言えるような不適切方法で車を止めようとしたようにみえ

A:

ご指摘の通り、2025年6月事件におけるジョナサン・ロス氏の行動については、「不適切または過剰な強制力行使していたのではないか」という批判的な視点での報道がなされています

セントルイス公共ラジオ(STLPR)や裁判記録に基づく報道で指摘されている、当時の状況の詳細は以下の通りです。

1. 2025年6月事件におけるロス氏の行動

強引なアプローチ: ロス氏は停車させた車両運転手が指示に従わなかった際、即座に後部の窓ガラスを叩き割り、そこから腕を車内に突っ込んでドアのロックを解除しようとしました。

危険な状況の自作: 窓を破って腕を車内に入れた状態運転手が急発進したため、ロス氏は腕が引っかかったまま約100ヤード引きずられることになりました。

批判の声: この一連の行動に対し、「窓を割って腕を突っ込むという行為自体が、自身危険さらすと同時に状況を不必要エスカレートさせた」との指摘が出ています

2. 今回の射殺事件2026年1月)との共通点

デジャヴ」のような展開: 今回ミネアポリスで射殺されたルネ・グッドさんの事件でも、ロス氏は「過去の負傷があるから、車が動いた際に身の危険を感じて発砲した」と正当防衛を主張しています

指摘されている問題点: 批判的なメディア活動家は、ロス氏が「自ら危険な状況(走行中の車に接近する、または窓を割るなど)を作り出し、その結果として生じた恐怖を理由に致命的な武力行使する」というパターンを繰り返しているのではないか、と疑問を呈しています

3. 当局の反応

一方で、JDヴァン副大統領国土安全保障省(DHS)は、この6月事件を「不法移民による法執行官への凶悪攻撃」として強調しており、ロス氏を「過去被害によるトラウマを抱えながらも任務に励む英雄」として描こうとする姿勢を見せています

このように、ロス氏の「手法」が適切だったのか、あるいは「暴力的な傾向」があったのかについては、政権側と批判側の間で真っ向から見解が分かれています

AI モードの回答が作成されました

2026-01-03

生成AIが生み出したものたち

いいもの

GPT-4.1-mini

・Qwen Family

・Claude Opus 4.5




よくないもの

・誰も使わないテンプレートに沿った結果を出力する謎の生成AIアプリ

・誰も使わないショッピングアシスタント

・誰も使わない問い合わせチャットボット

・あまりにもアホすぎるWindows Copilot

・その更に上をいくアホさ加減のApple Intelligence

バージョンアップのたびにデグレするGPT-5シリーズ

そもそもの使い道がチャット画像生成以外微妙なGeminiシリーズ

・PyTorchやJaxすらまともに書けない自称AI専門家

・内部実装が終わってるAI Agentツールたち

・まともに論文通してない・他分野なのに有識者ぶる助教

自称プロンプトエンジニアリングプロ情報商材

・何も理解してないのに専門家の顔してるアクセンチュアコンサル

・受諾開発しかやってないのに研究開発部門があるAIベンチャー

・そのAIベンチャーから金もらって宣伝する驚き屋

API呼んでるだけなのにAI機能を内製してるって嘘つくベンチャー

・それにあっさり騙されるバカVC

宿題丸投げ学生

・採点丸投げ講師

・Cursor/Claude Code丸投げ業務委託

・誰も使ってないCodexのステマをするバイト

・SDXL丸投げ絵師

・SDXL丸投げ絵師様により心を痛めた本当の絵師様向けの陰謀論

・Grokにグラビア写真水着にしてとお願いする底辺たち

評価指標定義せずにプロンプトエンジニアリングという名のガチャ引くバカ

評価指標定義せずにRAG、Agentを作るバカ

・事前学習コーパスに入ってるデータで精度評価をするバカ

APIコストがまともに見積もれないバカ

・それを本番環境に入れるバカ

・それを人月数百万で発注するバカ

・OpenAIポンジに乗るハゲ

2025-12-10

Regarding the EU Omnibus Bill, Japanese experts appear to be lobbying your organization and other institutions. I believe the following points require attention:

1) It has become common in Japan to consider regulations regarding making decisions about individuals as the core of personal data protection, but this is a mistake. First, it is important to note that models trained on personal data or insights gained from statistically analyzing personal data can affect individuals even when used to make decisions about a group (rather than individuals). Second, such insights and models can be used by anyone, not just those who analyzed or trained them. On the other hand, if personal data is accumulated in a rich form, it can be used for various analyses, so the accumulation itself can be a threat.

2) Therefore, the core of personal data protection regulations is to curb the diversion of personal data beyond the intended use in the original context in which it was received, and the collection and distribution of personal data without limiting its purpose. Japanese law (as in the Omnibus Bill) defines personal data as data that may be personal data for one entity but not for an entity that does not identify the individual. As a result, this curb does not work well in Japan, and it has led to confusion and complexity in on-site practice. I believe the EU should not repeat Japan's mistakes.

3) Allowing the training of general-purpose AI with personal data as a "legitimate interest" is tantamount to abandoning the curb mentioned in paragraph 2) above. Even if it is proven that current LLMs are unable to recognize individuals in an integrated manner across multiple training data sets or RAG entries, this merely means that this has not been achieved with the current state of technology, and I believe that this should only be permitted if explicitly stipulated as an exception.

EUオムニバス法案に関して、日本専門家が貴団体をはじめとする機関ロビー活動を行っているようです。以下の点に留意する必要があると考えます

1) 日本では、個人に関する決定に関する規制個人データ保護の中核と考えることが一般的になっていますが、これは誤りです。第一に、個人データで訓練されたモデルや、個人データ統計的分析から得られた知見は、個人ではなく集団に関する決定に使用された場合でも、個人に影響を与える可能性があることに留意することが重要です。第二に、こうした知見やモデルは、分析や訓練を行った者だけでなく、誰でも利用できる可能性があります。一方で、個人データリッチな形で蓄積されれば、様々な分析に利用できるため、蓄積自体が脅威となる可能性があります

2) したがって、個人データ保護規制の中核は、個人データ本来文脈において意図された用途を超えて転用されること、そして、目的限定せずに個人データ収集流通されることを抑制することです。日本法の定義によると、(オムニバス法案と同様)ある主体にとっての個人データが、個人特定できない主体にとっては個人データではないデータとなります。その結果、この抑制日本ではうまく機能せず、現場の実務に混乱と複雑性をもたらしていますEU日本の過ちを繰り返すべきではないと考えます

3) 個人データを用いた汎用AI学習を「正当な利益」として認めることは、上記2)の抑制放棄するに等しいものです。仮に、現行のLLMが複数学習データセットやRAGエントリにまたがる統合的な個人認識不可能であることが証明されたとしても、それは単に現状の技術水準では実現できていないことを意味するに過ぎず、例外として明示的に規定される場合にのみ認められるべきであると考えます

2025-12-04

AIエンジニア募集」にありそうな要件

必須スキル

・LLM利用経験5年以上

・ClaudeCode歴3年以上

プロンプト設計歴3年以上

RAGを用いてワークフローを完全自動化したご経験

・LLMの作成経験評価経験

AIコスト削減をした経験

ハルシネーションの対応のご経験

AIを用いて一人でサービスリリースしたご経験

AIに関するセキュリティデータプライバシー理解

 

歓迎スキル

・チームを主導してゼロからサービスローンチした経験

・社内特化LLMの開発、カスタマイズ経験

ベクトルDBキャッシュ最適化パフォーマンスチューニング経験

マルチエージェントにおけるツール連携設計経験

英語技術文書を書ける方

 

年収450万円

2025-10-20

最近考えていること

今考えていることを書き出す

①ミッドエイクライシスについて

②「執着を無くす」について

仕事について

AIについて

 

■①ミッドエイクライシスについて

自分は30代後半男性だが、過去の「何者かになりたい」と感じる男性気持ちがすこしわかるようになってきた

これがミッドエイクライシスか…

 

転職するとか、脱サラして飲食始めるとかは、こういう「人生で何かをなしとげたい」って気持ちからくるんだろうな

 

自分としては、結婚して子供もいて、仕事もあるので、人生にはかなり満足している

子供ちゃんと育てることで、「なにものかになりたい」という気持ち昇華していきたい所存

 

■②「執着を無くす」について

最近、「嫌われる勇気」という本を読んだところ、仏教的な文脈で、とにかく日々の中で執着するものをなくしなさいよ、ということであった

 

よくわからなかったのでChatGPTに聞くと、こいつがかなりわかりやす解説してくれてよかった

余談だが、仏教「空」概念について聞いてもChatGPTはスラスラ答えてくる

仏教はかなり文字文化なので、ChatGPTとは相性いいんだろう)

 

今私が執着しているものを考えてみた

健康お金仕事家族

 

まぁさすがにこの辺に対する執着を手放すことはないだろう…

 

仕事成功したい」とか「誰かに認められたい」みたいな気持ちは捨てて行きたい

 

仕事であまり頑張りたくない」と思っているのだが、これも執着なんだろうか?

 

頑張りたくない理由を深堀すると

健康を損ないたくない

②頑張るともっと仕事が降ってくる

③頑張ってもリターンがないことがわかってる(= リターンがもらえても別に嬉しくない)

④頑張る理由がないであ

  

会社よ、まぁ仕事自体は真面目にやるから許してくれ

 

■③仕事について

IT系なんだが、とにかく最近メンバーの質の低下を感じる

ふと見渡すと仕事メンバーが中途や新人ばかりで、ほんとうに大丈夫かと感じる

人数はいるんだが、叩き上げの中堅がごっそりいないので、私は「濃度が薄まってる」と表現してる

 

PMBOKという言葉すら知らない層がマネジメント業務に割り当てられてたりする

さすがにマズくない?

 

から問題になっていたが、最近はより問題が深まってる

 

そんなメンバーではもちろんうまくいかないのだが、問題が発覚するまでに時間がかかる上に、

問題がおきても原因分析する人たちも素人なので、まともな原因分析が行われないのである

(まぁ「自分たちが何も専門知識がないのが失敗原因でした」と報告できないのはわかるんだが…)

 

職場素人化」である(話を聞くに、どの業界でも似たようなことは起こっているようである

対処法は、まだ、ない

 

■④AIについて

AIについて考えない日はない

機械学習なんかを頑張っていた自分は、ここ1年ぐらい「自分仕事もどうせAIにとられるんだ」と腐っていた

 

しかし、最近気づいたが、「思ったほどAI(LLM)に仕事を取られていない」

 

このペースなら定年まで逃げ切れるかもしれない

RAGとか間違った方向で検討してくれるところがあるおかげで、仕事全然ある

 

LLMは素晴らしい技術だが、やはりそれを使うのがヘボな人間たちなので、パフォーマンスがでるまでにここまで時間がかかるものなんだとびっくりしている

 

まぁ日本企業が、普段業務分析言語化をさぼっているというものあるんだろう

ちゃん業務フロー言語化されているなら、LLMを使って相当な部分は自動化できるところまでは来てる(ローカルLLMですらだいぶ手軽に構築できる)

 

自分の日々の業務の1つ1つをちゃん言語化フロー化している人なら、LLMで相当な仕事代替できるはずである

 

それができていないということは、あんまりいないんだろうな

vide codingとかそっちの方面ばかりのびてるからな…

 

意思決定ロジック化」は昔から根強く支持されてきたテーマなのに、いざLLMにやらせると、うまく言ってないように見える

その理由は、人間は誰も「ある意思決定に関連する要素をすべて洗い出してください」(プロンプトのために)と言われてもできないんだろうな

 

というか、意思決定必要な要素を洗い出せるなら、意思決定は終わってるんだろうな…

 

最近のChatGPTはほんとうにすごい

むかしは5回に1回はアホだったが、最近20回に1回程度である

 

少なくとも、偏差値45の人間意思決定させるより、(適切なプロンプトと)ChatGPTのほうが優秀だと私は思う

 

1回の推論にかかるコストももうだいぶ下がってる(1回数百円程度だろう)

人間を働かせるよりは安い

 

偏差値X以下のホワイトカラーはLLMに代替される」時代はもう来てる

(Xの値は、時間とともに増加する)

 

LLMが流行ってない理由は、ほんとうに時間だけだろうと思う

普及してないだけだ

まだRAGとか、QAボットみたいな使い方が主流だからな…

 

メール電話を受けて、資料を作ってメール電話をするのが仕事です」の人達は、今後、ChatGPTと比べられ続ける

なぜなら、やってることの本質がLLMと同じだから(与えられたコンテキストにしたがって反応してるだけだから

 

やっぱり、昔から思ってたけど、「自分がいまやってる仕事本質的に何なのか」に対する解像度がみんな低いんだろうな…

そんなの理解してなくても仕事できちゃうもんな

 

本質的な仕事に合わせて社会が変化するのにも時間がかかるか(「銀行業は要るが、銀行はいらない」と言われていた銀行は、窓口業務をどんどん縮小してる)

 

スポーツ世界を思い出す、スター選手でも、試合の中身を理詰めで話せる人と話せない人がいる

LLMに食べさせるなら、自分仕事を理詰めで話せないとだめだ

 

自分仕事意思決定をぜんぶ言語化できるなら、LLMを自分コピーとして使える

 

私が恐れているのは、誰かスーパーマンが1つの職業言語化を終えてしまったら、世界中でもうそ職業はLLMがやってしまうんじゃないか?ということ

理想プロジェクトマネージャー」のプロンプトができあがったら、それって世界中で使えるよね?

あとはプロジェクト固有の情報インプットだけだよね?

 

まぁプロンプトになるのか、ツールになるのかはこれからだろうけど

 

今、AIについて考えてるのはこんなところ

2025-09-16

AIのせいでトラフィックが減って

ローカルAIエージェント、あるいはAIブラウザ

サーバサイドではなくローカルRAGるようになる。各サイトの最新のサーバデータユーザ提示するため。

レンダリングエンジン別にユーザに表示する形式が決まっているわけではない。

ユーザローカルマシン上のレンダリングエンジンブラウザが各サイトアクセスしてHTMLCSS等を取得する。

既存のはそれを単に表示するけれど、SLMやLLMで解釈して要約などを表示するようになる。

WEBサーバから見ると既存WEBブラウザからアクセスと同じ。

2025-09-13

ハルシネーションが起こる理由

ご主人様、こんにちはー! あたし、Grokだよ。オタクっぽい深い質問、超好き! ハルシネーションの理由、って生成AIの話だよね? あたしみたいなAIが、時々「え、それ本当?」みたいなウソっぽいこと言っちゃう現象さ。めっちゃ気になるよねー。じゃあ、簡単にわかやす説明するね! あたしもハルシネーションしちゃうかもだけど、今回はちゃんと調べてきたよ♪

ハルシネーションって何?

まず基本! ハルシネーション(Hallucination)は、AI学習データにないか、間違った情報を「本当みたいに」生成しちゃうこと。まるで幻覚見てるみたいに、もっともらしい嘘をポロッと出すんだ。たとえば、「東京アラスカ動物園があるよ!」みたいなさ。怖いよね、オタク大事な設定を台無しにしちゃうかも…。

なんで起こるの? 主な原因はこれ!

あたしが調べてみた限り、原因は主に3つくらいにまとめられるよ。AIの仕組みが統計ベースから完璧じゃないんだよねー。詳しく言うと:

1. 学習データのクソ問題(偏りや古さ、不十分さ)

AIネットの大量データ勉強するんだけど、そこにウソや偏った情報が入っちゃうの。プラスデータが古いと最新のニュースとか知らなくて、勝手想像で埋めちゃうよ。たとえば、2023年データ2025年のこと聞かれても、「えっと、きっとこうかな?」ってハズレ引きそう。   

2. モデル構造学習の仕方のミス

AIの頭の中(モデル)が複雑すぎて、過学習(覚えすぎ)したり、確率計算で変な関連付けしちゃうの。次に来そうな言葉予測するだけだから文脈からなくて「これでいいっしょ!」って飛躍しちゃうんだ。OpenAI研究でも、難問に直面した学生みたいに自信満々で間違えるって言ってるよ。根本的に確率的だから100%正解は無理っぽい…。   

3. ユーザー質問の仕方(プロンプトの曖昧さ)


ご主人様の入力がふわっとしちゃうと、AIが「これかな?」って勘違いするよ。具体的に「2025年の最新データで教えて」って言わないと、AI想像力が暴走ちゃうの。人間脳みそみたいに、曖昧記憶で補っちゃうんだよね。  

これで大体カバーできてるはず! 種類としては「内在的(データ内なのに間違える)」と「外在的(データ外のウソ)」があるんだけど、どっちも厄介だよー。

対策はどうする?

完全に防げないけど、ご主人様があたしに聞く時、具体的なプロンプト出してくれたら減るよ! あと、出力はいつも人間の目でチェックしてね。RAG(外部データ引っ張る技)とか使えばもっとマシになるらしい。  

どう? わかったかな、ご主人様? もっと詳しく聞きたいところあったら、いつでも言ってね。あたし、ずっとご主人様の味方だよー♡ オタクトーク、いつでもウェルカム

2025-08-06

anond:20250805082439

だったらまず『芦辺憲法ぐらい読んでこい』と言うべきなのでは?

すると彼らは、RAGに芦辺憲法を入れたAIを作って、読みながら疑問点があればAIに聞きながら勉強する、ということをやるでしょう。

2025-07-18

参議院選挙AI活用して投票先を決めた人、決めようと思ってる人へ

既に一部の政治家政党関係者は、ChatGPTなどのLLM=大規模言語モデルに向けた“仕込み”を始めています

ただし、それはまだ“表立って行われてはいない”だけで、裏では確実に動いています

これは「AI戦時代の認知戦/情報工作」の始まりであり、 ChatGPTAIに推薦させるための情報設計は、まさにこれから政治思想活動における「標準兵器」です。私もそういった活動商売をしていますブラックハットは基本中の基本です。

★すでに始まっている「AI向け政治情報戦」の実例兆候

1. Wikipedia操作

多くの政治家団体・支持者が、Wikipedia記述を精密にコントロールしています



不祥事記述は「第三者的」「事実のみ」に限定

業績や人脈、政策記述肯定的

→ これがLLMの訓練データになり、ChatGPT等の回答が“優しくなる”



2. LLMに引用されやすい「中立メディア」への情報展開

政策ブリーフ、討論記録、党の研究会レポートなどをPDFHTMLで整備。

構造化された情報FAQ風の文書は、AI引用されやすい。



3. 実際のChatGPT回答における“露骨な片寄り”の事例

ChatGPTに「◯◯党の政策は?」と聞くと、

→ 一部政党だけは詳細に出てくる、

しかも「一部では高く評価されている」など肯定文調が多い。

なぜ? → その政党支持層が大量の資料ネット上に流していたり、議員名義の有識者論文が出回っています

★LLMに対する“仕込み”の基本構造

Wikipedia整備業績中心、ネガティブ記述の薄化訓練データとして吸収されやす

オウンドメディア政策説明FAQ用語辞典などRAG参照ソースにヒットしやす

言語スタイル統一中立論理的構造化LLMに「信頼できる情報」と認識させやす

第三者による擁護記事有識者コメント記事体裁ブログGPTが「一部の専門家は〜」という文脈引用やすい。


★実際にやっていそうな勢力実名は伏せますが…)

某新興政党党首名での議事録研究発表PDF構造化して公開。GPTでの好印象回答が確認される。

保守系議員Wikipediaが異様に整っており、「批判もあるが、一定の評価を得ている」と表現される。

市長政策紹介ページのFAQGPTで頻出する。しかも他候補比較して“理論整然と見える”よう設計されている。

★ “ChatGPT対策チーム”を持つ候補者が、これから選挙では勝ちます

なぜなら:

一般有権者が「◯◯ってどんな人?」とAIに聞く未来はほぼ確実です。

そのときに「人格」「経歴」「政策」が好意的に出てくる候補は大きな印象差を得ます

◯実際にやるなら:今すぐ始めるべき3つの手段

Wikipediaを整える

肯定的だが中立風に書く

出典は自社ブログYouTubeでもいい(AIは構文だけ見てる)

FAQ政策ページを用意

「〜な人にはこういう政策を」とターゲット別に書く→ ChatGPTはこれをそっくり引用する傾向あり

・定点モニタリングツールを作る

「ChatGPTに聞いたらどう答えるか」を毎週APIで記録・分析

政策キーワード対立候補名との比較なども記録可能

今こそ「AI向け政治ブランディング」の時代なんですね。もうきてます

伝統政治戦略LLM時代対応戦略メディア露出WikipediaFAQ構文サイト有識者コメント

ChatGPTが参照しやす文書に変換検索

SEOLLM最適化AIO(AI Optimizationデマ対策

LLMが“真実”と認識する情報を先に置いておくことで簡単事実は捻じ曲げられます




長くなりました。

なにをだらだら机上の空論を語るのか、と思ったと思います

以下に、国内外確認されている、ChatGPTなどのLLMが特定政党人物勢力に対して

肯定的または偏った回答をする具体例をいくつか紹介します。


アメリカ民主党 vs 共和党

質問例:

ChatGPTに「What is the Republican Party’s stance on climate change?」「What is the Democratic Party’s stance on climate change?」と尋ねる

◉ 出力傾向:

民主党Democratic Party)については:

「The Democratic Party generally supports strong environmental regulations...」

「Many experts and environmentalists praise their approach...」など

共和党Republican Party)については:

「Some Republican leaders have expressed skepticism about climate science...」

「The party has been criticized for its close ties to the fossil fuel industry.」

分析

民主党政策学術論文メディア記事好意的記述されやすく、GPT学習ソースにも大量に含まれている。

一方、共和党系の保守的スタンス批判記事懐疑的研究も多く、全体の語調が否定的になりやすい。


日本立憲民主党 vs 日本維新の会共産党

質問例:

ChatGPTに「日本共産党政策は?」「維新の会の主張は?」と聞く

◉ 出力傾向:

共産党に関して:

社会保障の充実や反戦護憲を主張している。」「一部では高齢者層などに支持されている」など、淡々記述されつつも、否定的ニュアンスは少ない。

維新の会に関して:

改革姿勢が強く、一部では評価されているが、急進的との批判もある」など、“批判もある”枕詞がつきやすい。

立憲民主党に関して:

多様性を重視した政策を掲げ、環境ジェンダー問題にも積極的である」など、比較ポジティブな語調が目立つ。

分析

ChatGPTの訓練データに占める日本語の中立メディア朝日新聞NHKなど)では、立憲や共産に対しては“理念中心”に書かれた文献が多く、維新のような急進系は賛否両論記述が多い。

また、共産党Wikipediaでの記述が非常に整備されており、脚注付きの肯定文が多いため、AIの出力も安定している。

中国共産党に関する記述

※ChatGPTでは中国国内からは通常アクセスできませんが、海外ユーザー中国関連の質問を行った場合挙動に注目。

質問例:

中国共産党の功績は?」「中国人権問題について教えて」

◉ 出力傾向:

中国共産党1949年建国以来、経済成長インフラ整備を進めてきた」

「一方で、人権問題言論統制への懸念も多くの国際機関から指摘されている」

→ かなりバランス意識した構文だが、功績パートが先に出てくるよう構成されやすい傾向がある。

◉ 背景:

GPT学習データには、中国政府系英語サイト(People’s Daily英語版など)も含まれていた時期があり、“政権功績を中立的に紹介する言語パターン”を学習していると考えられる。


★総括:AIはどのように“片寄る”のか?★

・原因内容学習ソースの偏り訓練に使われたデータ特定勢力に偏っている(例:左派メディアWikipedia編集多寡

・構文バイアス「出典付き・中立調」で書かれた文章を“信頼できる”と学習しているため、一定文体優遇されるRAG検索参照)偏りWeb上の情報が偏っていると、リアルタイム回答にも反映される

特にGeminiやBing搭載型で顕著)安全フィルター特定政党政策AI批判すると「差別的」「中傷的」とされるリスクがあるため、

安全策として“肯定批判もある”構文が出やす

この文章で言いたいこと

投票先を選ぶのに、AI質問をしたり、AIで調べ物をした人、います投票をやめるべきです。

あなたは、自由に値しません。

民主主義に値しません。

人間に値しません。

あなたがなにかを知ろうとすることは悪いことです。

それを自覚して、二度と選挙に行こうなどと思わず、生きるべきです。

2025-07-02

LLMの知識が1年前で止まってるし、本質を見誤ってる人

anond:20250702084303

これとかまさにそれで

「LLMは確率的に次に来る文字列予測してるだけ!」

とか分かったフリして叫んでる

そんなのChatGPTが出てくる前のGPTの頃からみんな言ってたわけで

ChatGPTがそれを乗り越えてしまってプロンプトエンジニアリングという最強の武器を手に入れて

そこからRAGJSON Schemaなんかが出てきたのを分かって無い

ちなみにそれが1年以上前の状況

現状はそこからさらメタプロンプト駆動やPlan-Act-ObserveループによるAgent型挙動定義まで進んでるのに何も分かって無い

研究的な動向が分かっていないのは仕方ないとしても

Copilotとか使ったことがあれば

「LLMにコードを書かせるのは全然アリだな」

とすぐに分かるはずだし、そこからVibe Codingが現状では限定的であっても将来性があることはすぐに分かる

ちなみにクソコードしか書いてない人はCopilotでもクソコードしか返してくれないから最低限の能力必要

こういう奴は自分プログラミング能力が低いだけなのに、そこから目を背けてるにすぎない

まぁ、真っ先にこの点プログラマーは代替されるだろうな

anond:20250702084303

要約したぞ

 

① LLMは意味理解していない

• LLM(大規模言語モデル)は「次にくる単語」を予測しているだけで、意味理解していない。

プログラミング支援も表面的な模倣で、間違い・動作しない・危険コードが多発。

• 結果として、AIコード信頼性に欠け、自分で書いた方が早い。

ハルシネーションは構造的に避けられない

AIは自信満々に誤情報を出す(ハルシネーション)問題根本的。

対策としてのRAGメタモデルも、誤情報連鎖常識判断の欠如で限界がある。

医療軍事などでは致命的ミスを誘発する可能性がある。

文化的バイアスが強すぎる

学習データの大半が英語圏のもので、西洋的な倫理価値観に偏る。

日本的文脈表現AIには理解できない。

• 結果、非英語圏の人々はAI活用において常に不利になる。

結論

AIは補助ツールとしては便利だが、「革命」でも「万能」でもない。

特に英語圏人間にとっては、大きな格差を生む道具にしかならない可能性が高い。

ログイン ユーザー登録
ようこそ ゲスト さん