「@chat」を含む日記 RSS

はてなキーワード: @chatとは

2025-11-23

Gemini 3.0 Pro要緊急対策のご提言へのツッコミ

レポート引用している記事ツイートなど個人の感想の中身については基本スルー、それらを元に提言を生成したAIによる解釈ミスハルシネーションにツッコミ増田

ちなみにこの提言ページがGoogleインデックスされたのは4日前らしい。

レポート:

Gemini 3.0 Pro要緊急対策のご提言

https://paste.ssig33.com/8a22a6e9-a91d-4368-9b2f-a3d4567c7798


1

Gemini 3.0 Pro要緊急対策のご提言
宛先: Google社 シェイン・グウ様
差出人: アクセンチュア株式会社 生成AI戦略担当 シニアコンサルタント
日付: 2025年11月21日

Shane GuGoogleDeepMindであってGoogle社ではない。

差出人については「あなたアクセンチュア株式会社の生成AI戦略担当 シニアコンサルタントです」と指示された結果なのかは知らん。

2

エグゼクティブマリ
主な問題点は以下の4点に集約されます事実性の著しい低下: Web検索を伴うタスクでのハルシネーションが悪化し、自信を持って虚偽の情報を生成する事例が多発。
論理的思考能力の退行: 複雑な指示やコーディングタスクにおいて、前モデル(Gemini 2.5 Pro)よりも論理破綻やすくなっている。
創造性と柔軟性の欠如: 文章生成において「賢すぎる」が故に理屈っぽく、ユーザーが求める「人間らしい」文体への調整を拒否する傾向。
API不安定化: パフォーマンス低下、APIエラー、予期せぬタイムアウトの増加が開発者体験を著しく損なっています

後で分かるが(たどり着く前に書くの飽きたんで提言読んで)、このうち

API不安定化: パフォーマンス低下、APIエラー、予期せぬタイムアウトの増加が開発者体験を著しく損なっています

についてはGemini 2.5 Proのユーザーが「おい調子悪いぞ!Gemini3出すためにそっちにリソース割いてんじゃね?」とか言ってるのを引っ張ってきて勘違いしてる。

論理的思考能力の退行: 複雑な指示やコーディングタスクにおいて、前モデル(Gemini 2.5 Pro)よりも論理破綻やすくなっている。

このソース不明

3

1.1. ハルシネーションと事実誤認の悪化:「自信満々に嘘をつく」AI
Gemini 3.0 Proの最も深刻な問題は、事実性が求められる場面でのハルシネーションの増加です。特に、貴社のコア技術であるはずのWeb検索連携において、致命的な欠陥が報告されています

自己認識に関するハルシネーション:

Redditでは、Gemini 3.0 Pro自身が「私はGemini 3 Proです。昨日(2025年11月18日リリースされました」と、架空ソース引用しつつ自己紹介する事例が投稿されました。これはモデル自身アイデンティティ知識カットオフに関して、もっともらしい嘘を生成していることを示唆しています。 Gemini 3's thought process is wild, absolutely wild. : r/singularity

参考記事ではモデル思考が混乱している様子と実際の応答との乖離が示されていて、最終的に正しいソースを元に正しく回答している。「架空ソース引用しつつ自己紹介する事例」ではない。

Googleは生のThinkingをユーザー提示せず、要約モデルで処理した結果を見せてるだけなんで思考部分と返事のすれ違いはよくある事。これについてもスレに書かれてある。

4

1.2. 論理的思考コーディング能力の退行(リグレッション)
Gemini 3.0 Proは「PhDレベルの知能」と謳われているにもかかわらず、多くのユーザー論理的思考コーディング能力において、前モデルであるGemini 2.5 Proからの明らかな退行を報告しています

論理破綻と浅い推論:

ユーザーからは「複雑な指示では論理破綻する」との指摘や Gemini研究リョウスケ (@chatgpt_ai_bard) / Posts / X、「浅い推論(shallow reasoning)」しかせず、「ひどいハルシネーション(terrible hallucinations)」を伴うため、「ベンチマーク用のモデルだ」と酷評されています。 lluviampo (@XXXadiov2)

ここでリンクされているGemini研究リョウスケはGemini大好きマンで、まったくそんな話をしていなかった。もしかすると呟いていたかもしれんが、それならリンク先がポストではなくアカウントホームになっているのは不自然

DeepResearchはよくソースの取り違えをして、別のソースで書かれてた事に間違った引用元をつける事はあるが、これがそうなのかは分からん

5

1.2. 論理的思考コーディング能力の退行(リグレッション)
・コーディング能力の劇的な低下

壊れたコードの生成: エージェントタスクにおいて「ループに陥り、壊れたコードを書き、10分以上動作しない」という深刻な不具合が報告されています。 prylo (@AgiGuard8)

元のツイでは

エージェントタスクは全くダメループする、壊れたコードを書く、フロントエンド以外のコーディングではトークンを異常な速さで消費する。このモデルは最悪だ。Gemini 3.0 Proは10分以上動作しない。

と言っているが、これをモデル不具合解釈するのは間違いだろう。たまにマジの不具合もあるが。

====

バグの再発と整合性喪失: ある開発者は、旧モデルで失敗したツール開発をGemini 3.0 Proで再試行したところ、一発で高品質コードが生成されたと肯定的評価する一方で、別の文脈では「直したはずのバグが復活する」「最終的にはコード整合性が取れなくなる」といった、旧モデルと同様の問題が依然として存在することも示唆されています。 【検証】Gemini 3.0 Proの実力は?かつてAI挫折した開発に「同じプロンプト」で挑んだ結果|start with AI

リンクされた記事の中身を要約すると「以前のGeminiはバグが復活するとか色々あったけどGemini 3.0 Proマジパネェ!」だった。

この箇所で「旧モデルと同様の問題が依然として存在する」と書かれているのは、旧モデル問題点として挙げた箇所をGemini3に対しての指摘だと勘違いした事による。

====

ベンチマークテストでの失敗: YouTubeでの検証動画では、チェス盤を自動プレイさせるタスクにおいて、Gemini 3のチェックポイントモデルが初めて失敗したことが示されました。これは、特定の複雑なロジックにおいて、以前のバージョンより劣っている可能性を示唆します。

ここでリンクされているのは、LMArenaでRiftrunnerモデルテストした結果をまとめた動画。LMArena覆面調査環境、RiftrunnerはGemini3らしきモデルコードネーム。LMArenaでは(出力から推測されてきた)Gemini3系列モデルが、これまでにいくつかでている。

よって「Gemini 3のチェックポイントモデルが初めて失敗した」の意味はつまり「これまでLM ArenaテストされていたGemini3系列モデルのうち、Riftrunnerは初めてオートチェスのコーディングに失敗した」である

「以前のバージョンより劣っている可能性を示唆」とは、「Riftrunnerは、以前の匿名Gemini3系列モデルより劣っている可能性がある」という話で、そもそもRiftrunnerが、リリースされたGemini 3 Proなのかすら分からん

====

思考プロセスの出力への漏洩:

GitHubIssueやTwitterでは、モデルの内部的な「思考プロセス」が最終的な出力に混入し、制約を無視した意味不明コンテンツを生成するバグが報告されています。これは「初期の2.5 Proバージョンへの回帰(regression similar to early 2.5 Pro versions)」のようだと述べられています。 Jason L (@Jason1820067393)

Google AI Studioでの話。初期指示を忘れた結果思考が垂れ流しになり、垂れ流しのせいで更に指示を忘れたのだろうが、バグとは違う。

リンク先のツイートでは

I'm encountering a significant issue with the Gemini 3.0 Pro Preview on AI Studio.

​The raw "Thinking Process" is leaking into the final output, the model fails to follow constraints, producing hallucinated/gibberish content. Like a regression similar to early 2.5 Pro versions.

と書かれていて、これは正しい観察。

ここに含まれIssueという単語により、Issueと言えばGitHubだと連想した結果「GitHubIssueやTwitterでは」になったのだろう。

6

飽きました。誰得だよ。

つーかいい加減DeepResearchは一気に生成すんのやめろよな。だいたいこうやって収集した情報がごっちゃになるんだから

2021-04-20

ノーマスクピクニック主催者垢→転生先

メモ

世田谷

@nyaopon55

西東京

@bilingualrapper

城北

@akanereinbow(別の人がID取得)→@WTPM147258

秋田

@chatarooo1109

茨城

@black_d_dc

横浜

@camomilla115→@allimomac

@kumama3737→@kmm318318

埼玉

@DjBJrbOGh9DZVw1

千葉

@taisaku1204→@hanagongon0807

大阪

@MakeJapanGreat9

明石

@QcXI3QGM39Sgog0

広島

@nicoaaa012020

香川→中止

@IrKaoru

福岡(太宰府)

@tommymn28

鹿児島

@OENOENOENEO

沖縄

@ike45677130

2019-07-11

anond:20190711122207

増田ツイート貼れるぞ。

2018-09-14

悲報フェミによって「毅然として純潔を保つ女性キャラ」がフィクションに出せなくなる

今回のエロ表紙の件。

もちろんフェミの皆様は、表層的な絵柄や露出だけを見て、安易拒否反応を示しているのではない。

イラストに描かれたキャラクター本質、および、そこに反映された作者の意図のものを、深い洞察によって見抜いたうえで否定しているのである

ということを理解した上で、問題とされた『境界線上のホライゾンXI(中)』の表紙を飾る葵・喜美というキャラクターについて見てみよう。

「喜美には皆、頭上がらないんです。」

基本的自分中心主義であり、「女」であることに対し独自の持論と誇りを持つ。

容姿スタイル名前さえも自分にとっては「飾り」として服などと同一の存在と見ており、その認識故に蜻蛉切の割断能力が通じなかったこともある。

「私は、負けない女が好きよ」

「負けない男も好き」

「負けない私が最高に素敵」

「高嶺の花は、そこに至れる者にしか姿を拝ませないわ。そしてそれを枯らさず持ち帰る事なんて出来やしない。だから高嶺の花は孤高に咲き続け、その山の"不可侵"であり続け、高き場所に至れる者達の共通崇拝となるの」


でもま、こういうキャラが「女性支配したいという男性の願望が反映されている」として糾弾されてるんだからしょうがないわなー。

これからは地味な外見で男性に隷属して誰彼構わずヤリまくるビッチを出していこうな。

そうでないと「性的消費」「性的搾取」で「差別」で「加害」だと言われてしまうんだから仕方がないよ。

2009-01-28

[]キーワードアンカー文字列にあるとそこからキーワードリンクにされてしまう

おそらく一昨日の激しいMOJIBAKE不具合の発生原因となった修正によると思われる、キーワードアンカー文字列にあるとそこからキーワードリンクにされてしまう、という別の不具合が発生している。

日本語などの例

+[http://anond.hatelabo.jp/:title=はてな匿名ダイアリー]
+<a href="http://anond.hatelabo.jp/">はてな匿名ダイアリー</a>
+[http://anond.hatelabo.jp/:title=&#x306F;てな匿名ダイアリー]
+[http://anond.hatelabo.jp/:title=これがはてな匿名ダイアリーの姿]
+[http://anond.hatelabo.jp/:title]

現在、上記のように書くと下記のようなリンクが生成される。

  1. はてな匿名ダイアリー
  2. はてな匿名ダイアリー
  3. はてな匿名ダイアリー
  4. これがはてな匿名ダイアリーの姿
  5. はてな匿名ダイアリー

5番目のパターンは、多くの文字の数値文字参照化と取得した文字との関係で起こっている現象であろうと、たとえば「YouTube - Broadcast Yourself([http://www.youtube.com/:title])」等から推察できる。

英数字の例

+http://www.hatelabo.jp/
+http://anond.hatelabo.jp/
+[http://www.hatelabo.jp/:title=http://www.hatelabo.jp/]
+[http://anond.hatelabo.jp/:title=http://anond.hatelabo.jp/]
+[http://anond.hatelabo.jp/:title=http://www.hatelabo.jp/]
+[http://www.hatelabo.jp/:title=http://anond.hatelabo.jp/]

例えばwwwとこのエントリー内に書いてありキーワードリンクが発生している条件では、上記の内容が下記のようなリンクになる。

この時、ASCII文字によるanondもキーワードである事に注意。

  1. http://www.hatelabo.jp/
  2. http://anond.hatelabo.jp/
  3. http://www.hatelabo.jp/
  4. http://anond.hatelabo.jp/
  5. http://www.hatelabo.jp/
  6. http://anond.hatelabo.jp/

これは若干異なるものの、以下のように連続した英数字からなる文字列の場合は途中でキーワードリンクにならないが、他の場所でキーワードリンクとなってる文字列の場合はキーワードリンクとなる従来の仕様の影響かもしれない。

  • anond0
  • abcwwwxyz

このほか従来からのpタグ(下記参照)に加え、&amp;や&gt;(ASCII文字による&と>)等の不具合も出ている。

<p&gt;

しかし、この修正でhttp://anond.hatelabo.jp/20070129012129と同一の内容であっても、多くのキーワードが正常にリンクされるようになった。

OK

C# $10 (T_T) *ist D +ANIMA yes,mama ok -196℃ .book c/w :active ave;new アンリ・カルティエ=ブレッソン ?B @CHaT [TV] ^H _no PE`Z ||リ・_・`川

文字参照ならヒットするもリンク書き換えならず

AirH" AirH" 女子高生 GIRL'S-HIGH 女子高生 GIRL'S-HIGH MÄR MÄR (*゚∀゚)ノ パキャッ (*゚∀゚)ノ パキャッ

文字参照に変換されるため双方上と同様に

R&B R&B のどごし<生> のどごし<生>

キーワード文字参照ではないが変換されるためヒットせず

P&G

存在するはずだがたぶんはてな側の問題かな?

!K7

含むキーワードを見つけられず

% \ { } ~

キーワード関連

<p&gt; <p&gt; <p>

というわけで、残るは文字参照関係だけかな。

また、近い問題としてhttp://anond.hatelabo.jp/20070328234724もあげておく。修正されていた。

結論としてエスケープは面倒臭

2008-12-19

o 21 !K7

22 AirH"

o 22 AirH"

22 AirH&amp;quot;

o 23 C#

o 24 $10

  • 25 %

26 R&B

o 26 R&B

26 R&amp;amp;B

27 B'z

27 B'z

o 28 (T_T)

o 29 (T_T)

o 2a *ist D

o 2b +ANIMA

o 2c yes,mama ok

o 2d -196℃

o 2e .book

x 2f c/w

o 3a :active

o 3b ave;new

3c のどごし<生>

3c のどごし<生>

o 3d アンリ・カルティエ=ブレッソン

3e のどごし<生>

3e のどごし<生>

x 3f ?B

o 40 @CHaT

o 5b [TV]

5c \

o 5d [TV]

^H

o 5f _no

o 60 PE`Z

7b {

o 7c ||リ・_・`川

7d }

7e ~

MÄR

o MÄR

(*゚∀゚)ノ パキャッ

o (*゚∀゚)ノ パキャッ

P&G

P&G

2007-01-29

[]キーワードテスト

OK

C# $10 (T_T) *ist D +ANIMA yes,mama ok -196℃ .book c/w :active ave;new アンリ・カルティエ=ブレッソン ?B @CHaT [TV] ^H _no PE`Z ||リ・_・`川

文字参照ならヒットするもリンク書き換えならず

AirH" AirH" 女子高生 GIRL'S-HIGH 女子高生 GIRL'S-HIGH MÄR MÄR (*゚∀゚)ノ パキャッ (*゚∀゚)ノ パキャッ

文字参照に変換されるため双方上と同様に

R&B R&B のどごし<生> のどごし<生>

キーワード文字参照ではないが変換されるためヒットせず

P&G

存在するはずだがたぶんはてな側の問題かな?

!K7

含むキーワードを見つけられず

% \ { } ~

キーワード関連

<p&gt; <p&gt; <p>

というわけで、残るは文字参照関係だけかな。

 
ログイン ユーザー登録
ようこそ ゲスト さん