はてなキーワード: ギブアップとは
ここ最近Claude Opusの出力がなんか微妙なことが多いなと思ってたんだけど、自分の使い方が悪いのかプロンプトが雑なのかと思ってスルーしてた。でもちょっと調べたら同じこと感じてる人めちゃくちゃ多くて、これもしかしてこっち側の問題じゃなくない?ってなったので書く。
きっかけは先週、いつも通りClaude Codeで作業してたら、前は一発で通ってたようなタスクで妙にトンチンカンなコードが返ってきたこと。指示を読み飛ばすとか、自分で立てた計画を途中で忘れるとか。まあAIだしそういう日もあるか…、くらいに思ってたんだけど、翌日も、その翌日もおかしい。
気になってXでClaude Opusで検索したら出てくる出てくる。「Opus 4.6 has become noticeably dumber」「ハルシネーション増えた」「Claude Codeが使い物にならない」。
1.1万いいね超えてる投稿で「指示無視、リトライ地獄、quota消費が異常に速い」と。英語圏のパワーユーザーがブチギレてる。
Redditも見てみた。r/ClaudeAIとr/ClaudeCodeが阿鼻叫喚。「ここ1-2週間で明らかにdumberになった」「同じプロンプトなのに以前と全然違う」みたいな報告が3月後半に集中してる。「lobotomy(ロボトミー)」って表現を複数の人が独立に使ってて、体感の一致がすごい。
GitHubのclaude-codeリポジトリのissueも見に行ったらもっとやばかった。3月6日に「本番パイプラインが突然壊れた、Opus指定してるのにSonnet 3.5レベルの出力になった」。3月15日に「1Mコンテキストの40%地点で性能劣化が始まり、48%でClaude自身が”もう効果的に動けない”と言い出した」。3月17日に「Maxプランなのに単純なプロンプトで10-15分ハングする」。これ全部別の人が報告してる。
じゃあAnthropicのステータスページはどうなってるかと思って見に行ったら、3月のインシデント一覧がすごいことになってた。2日に大規模障害、11日にエラー率上昇、16日にSonnet障害、17-18日にOpus連続死、19日に認証障害、20日にレスポンスハング、21日にOpus・Sonnet同時エラー、25日に部分障害、26-27日にまたOpus・Sonnet障害。ほぼ2-3日おきに何か起きてる。これ普通なの?
で、何が起きてるかの仮説がいくつか出回ってる。
一つ目は、サーバー負荷でこっそり軽いモデルにルーティングされてる説。Opus指定してるのに裏ではSonnetとかもっと下が返答してるんじゃないかと。同じセッション内で賢い回答とアホな回答が交互に来る現象はこれで説明がつく。
二つ目は、次期モデルの準備でサイレントにチューニングされてる説。MythosだかCapybaraだかいう次期モデルのリーク情報と時期が重なってて、Opusの創造性や柔軟性が削られてるんじゃないかと。過去のClaudeでも新モデル前のロボトミーは定番らしい。
三つ目は、需要に対してインフラが単純に追いついてない説。MacRumorsの報道によると、ピーク時間帯のセッション制限が実際に厳しくなったらしく、Anthropic自身が「約7%のユーザーが以前は当たらなかった制限に当たる」と認めてる。需要増→サーバー過負荷→レスポンス品質低下、というシンプルな話かもしれない。
個人的に一番引っかかったのは1Mコンテキストの話。公称100万トークン対応を大々的に宣伝してたけど、GitHubの報告だと実効的に安定してるのは20-25万トークンで、40%あたりから忘却が始まり、半分も使わないうちにClaude自身がギブアップ宣言する。それを「1Mコンテキスト対応!」と売るのは看板に偽りありでは。
面白いのが、結果としてSonnet 4.6のほうが実用的という声が出てきてること。速度は3-5割速い、安定性は高い、コーディングベンチマークもOpusとほぼ変わらない。フラッグシップの意味とは。
正直、自分の体感だけだったら気のせいかな、で片付けてた。でもGitHubのissue、ステータスページの障害履歴、英語圏の大量の報告を見ると、これは気のせいじゃないんだよな。Anthropicはステータスページで「investigating→resolved」を繰り返すだけで、何が原因で品質がどう変わったかの説明がほとんどない。1月にも同じような品質低下があって、そのときは後から「ハーネスの問題でした」と認めた。今回も数週間後にしれっと「直しました」って出るんだろうか。
数年前の6000回記念で番組から記念にプレゼントがありました。
不特定多数のリスナーが聴いている番組だったから、当選するとは思ってもいなくて、シャレのつもりで応募しました。
応募したのをとっくに忘れた頃に、分厚いものが届きました。
プレゼントは、本「TBSラジオ公式読本」(開局70周年を記念した本。扉に生島氏のサイン入り)とカード(生島氏のスタジオ内での写真に手書きの「一日一生」)でした。
で、本はざっくり読むか読まないかの調子で、内容的に途中でギブアップ。
そして2025年1月末。
7000回を目前にして、自身の長年の自業自得の言動行動で番組はジ・エンド。
朝5時半から10年以上断続的に聴いてはいたけれど、良い印象がなくなっていったのは確かです。
終了してホッとしました。
それ以前から、読むつもりはない本の(カード込みで)処分を考えていました。
正月明けの左義長で焼いてもらう(表向きには正月関連の物以外は持ち込めないことになっているけれど)とか。
いかんせん分厚い本だしサイン入りなのが難点で、仕方なく記念として手元に置いておくことに。
写真の生島氏のにこやかそうな表情は、見ているだけで嫌な気分になります。
裏側でどれだけの人が嫌な思いをしてきたのか。
多くの人が1年余での早過ぎる復帰を望んでいないだけでなく、二度と見たくないし聴きたくもないのは当然だと思います。
私もそうだと言いたいです。
ホッテントリにそんな記事が上がってたのを見て、思ったことを適当に書く。
なんでプレステ独占タイトルがPCにも出るようになったかといえば、その原因は右肩上がりで増え続ける開発費がPS5だけじゃ支えられなくなりつつあるからだ。
ハードの性能を活かしてリッチな体験を作り込めば作り込むほど金がかかるのは当たり前の話。
Days Goneのスタジオが「何百万本も売れても続編開発のゴーサインが出ない」って嘆いてたのとかがその辺をよく表してる。
PS5はよく売れてるけど、それでもその性能を活かしたゲームを作る為の売り上げを支える土台としては不十分になってしまってる。
ハードの売り上げ台数が足らないんじゃなくて、開発競争の過熱でAAAAタイトル開発費が膨張し過ぎたというのが正しいんだろう。
業界の潮流的にも人員整理が進んでいて予算拡大しようにもやりようがなくなってることもあるし、高性能ハードの競合相手は既にギブアップしてるのでファーストパーティのタイトルを競争のためにカリカリにチューンする必要性も薄れてきた。
PCサポートの大変さもこれまでの失敗を経て痛いほど理解してるのもあるだろう。
いろんな理由が重なって「金をかけて作り込む動機」が薄れてきてることも考えると、「無理して拡大路線を邁進しなくてもいいのでは?」という判断もあると思う。
ちょうどメモリ高騰などもあり後継機種のリリースも遅れそうだし、もうしばらくPS5時代が続くことを考えると、「PS5独占のビッグタイトルがそこそこの売り上げでも生き延びられる」という方向に舵を切ってもいいと思う。
馬鹿正直にネイティブ4KでレンダリングしなくてもAIで綺麗に高解像度化すればいい雰囲気にもなってきてるし、莫大な予算かけなくてもゲーム会社が食いつなげる環境づくりの方を優先するのはアリだと思う。
そしてそれをやりやすいのは「ファーストパーティのタイトルはPS5だけ面倒見ればいい」という方が実現しやすいのは間違いない。
20代女。前リーダーが転職で辞めたので少人数のチームをまとめることになった。
そのタイミングで人員が1人補充された。私より1〜2個下の中途入社の男の子。仮にAくんとする。
そうなんだって思った。その後、あれ?そういう枠だっけ?と思った。
弊社にはADHDとかASDとかそういう人たち用の採用枠がある。若干給料は減ったり部署が限られたりするけど、そういう人たちが得意とする仕事を振るようになってる。ちなみに私のチームではそういう仕事はないので入れることはない。
なのに2日目でカミングアウトしてきた。上司とか人事に聞いてみたけどそういう話は聞いてないって言われた。
「五十音順で並べろって指示だったのに "その他" が最後にきてるのでこの資料は間違ってます」
「手順通り機械を弄ったけど動かないので不良品です。主電源は手順に入ってないので入れなかったです」
「この締め切りって守った方がいいんですか?」
「(報連相は早めにしてね、に対して)分かりました。早めに質問に答えるようにします」
正気か?と毎回思う。
仕事ができないとかいう話じゃなくて、シンプルに一般常識がなさすぎる。あと理解力もない。
私の指示も上司の話も後輩の言ってることも何にも正しく理解してくれないし、やり取りに他メンバーの3倍ぐらい時間がかかる。教育を任せようと思ってた他メンバーからは「手が出そうになりました」って1週間ぐらいでギブアップ宣言が出た。
そして一応本人もそれを自覚してるらしい。ことあるごとに「何にもできなくてごめんなさい」とか「何の役にも立てずにすみません」とか言ってくる。
正直それもずるくない?と思う。そんなこと言われたら私は「そんなことないですよ」「助かってますよ」って言うしかないじゃん。全然そんなことないのに。Aくんができなかった仕事とかAくんの相手してできなかった自分の仕事で毎日残業してるのに。
その上Aくんは「この現場に入ってから胃腸がやられた」って事あるごとに言ってるらしい。私だって最近睡眠薬がないと眠れないのに。
Aくんがこの現場に入る時に、上司に「Aくんは前の職場でパワハラ受けてたらしいから」って言われたけど今となっては「だろうね」としか思えない。
誰だって「メールは○○さんに見てって言われなかったので見てないです」って言われたらキレたくもなると思う。それも私が言わなきゃだめだったの?本当に?今までずっとそうだったの?
本当に本当に本当に最悪だけど、メンタル崩すならさっさと崩して辞めてほしい。じゃないと私が先にやられてしまう。お酒の量も増えてきたし、毎晩勝手に涙出てくるし、今日もAくんの相手するんだって思ったら頭真っ白になる。
何でそんなことも分かんないの?そんなに難しい話してる?できないお願いしてる?メールは私が言わなくても見てほしいとか、進捗遅れてるなら私が聞かなくても言ってほしいとか、資料読んで分からない単語があったら調べてほしいとか。そんなに難しい?できない?言わないと分かんない?
このチームの暗黙の了解じゃないよ、一般常識の話だよ。そんなことまで私が教えなきゃいけないの?20代半ばで、社会人歴だけで言ったら私と同じぐらいの人に?
でも私はAくんの上司だからそんなこと言ったらパワハラになるんだろうな。いや、もうなってるのかも。
対面で話したら苛立ちが表に出ちゃうからってチャットにしてみたけど、多分それも「相談がしづらい職場」とか「疎外感を感じる職場」なんだろうね。だからといって対面に戻して、私がちょっとでも態度に出したら「威圧的な上司」になるのかな。
結構この会社も現場も好きだったんだけどな。初めてリーダーになったから頑張ろうって思ってたんだけどな。私には無理だったのかなぁ。こんなに人を嫌いになったの初めてだよ。最悪。
下の子(2歳の娘)にどうしても手がかかるので
6歳の娘は「ママは妹ばっかり見てズルい」と妬む
母と娘2人の3人で外出して遊んでも、やはり親は妹中心の対応になってしまうから、
冬休みは園に冬期預かりをお願いして
長女は「なんで自分だけ園に預けられるんだ」と思っている
今は体力残ってない。
長女も次女も殴り倒したくてたまらなくなる瞬間があるけどちゃんと理性を保って我慢してる
もし、私が3人目の子供を産んでいたら、林敦子や遠矢姫華のように自分の子供全員殺してると思う
林敦子も遠矢姫華も子供3人の面倒を見ることに疲れて自分の人生に絶望して殺したんだと思う
林敦子にいたっては、不登校の息子1人だけを、殺すならまだ、(決して許されることではないが)社会に適応できない息子に相当いらついてたんだなと想像できるが
よっぽど3人の子供に尽くすことに愛想がつきたんだろう
我が子にばっかり時間がとられて、自分のことが二の次三の次になるのも嫌だし
母親ヅラして、それなりに聖母のフリをして、子供がどんなに荒れてても私はあなたの味方ですよって態度取らなきゃいけないのつらい
子供1人育てているだけで限界が来て、精神疾患になってしまう、育児のキャパが子供一人分しかない母親だって世の中にはいる。子供1人でキャパオーバーの母親はあまり育児を楽しめないタイプなんだと思う
私のキャパは子供2人分だけ。なんなら、1.5人分くらいしかないのかもしれない。1人なら余裕があるけど2人でもうキャパギリギリか
林敦子や遠矢姫華の事件記録を読めば、私が子供3人産んだら、毎日毎日イライラして、ある日プッツンと線が切れて、彼女たちのように自分が産んだ子供達全員殺すんだと思う
子供を望んで産んだのは自分なのに、頼まれてもいないのに、勝手に産んで、自分の限界を超えるような育児をしておいて、
[追記]
あいつら(遠矢姫華と林敦子)とは違って、私はまだ子供2人だから大丈夫!!と自分に暗示をかけるのは、大事だと思います。
遠矢姫華と林敦子の気持ちはこうだったんだろうなと想像して、共感はできるけど、
子供達を殺したあの2人のことは本当に大嫌いです。嫌悪してる。遠矢姫華は死刑になってほしかった。
実際、娘達が成長したらどんどん「大丈夫」になっていくんだと確信しています。小学生のママさんたち、楽しそうだよね。
私のママ友はお子さんが小学生になったら1人で旅行してました。
子供達が小学生になったらなったでまた、子供が幼児のときとは違う大変さがあるんでしょうが。
子供の進路のことで子供と揉めて号泣したりしてるお母さんの話とか聞くと大変だなと思う。
私自身は世の中にたくさんいる一般人の母親のうちの1人に過ぎず、
子供に手をかけて逮捕されるようなタイプの母親ではないので、安心してください。
私はどこにでもいる普通の子持ちオバチャンのうちの1人でしかありません。
私には実現させたい夢があるので、自分の大切な子供達に酷いことをやって、逮捕されて刑務所に入ったり、裁判にかけられたりしてる時間はないんですよ。そんなくだらないことしてる時間はもったいない!!
子供が長女だけだと、それはそれで精神的にも経済的にも楽だったろうけど
絶対に物足りない人生だったから(長女ごめん)、次女を産んで大正解だったと思ってます!!子供3人育てるのは絶対に無理だけど子供2人なら、なんとかなるさと思って夫と選んだ道です。
塾の増田が「小学校のテスト20点は本気でやばい」「そもそも問題の意味がわかってない」って書いてたやつ読んで、
「あ、うちだ…」と思ったので、実際にそのゾーンを歩いてる親側の記録を書いてみる。
だから「親がそこそこ稼いでる=子どもも勉強できる」みたいな図式は、
で、うちの子。
算数は積み上げ科目だから、つまづいたところを一個ずつガチで潰さないと未来で地雷になる、
と思ってるので、そこに時間と労力をめちゃくちゃ注ぎ込んでいる。
具体的にどこでつまづいて、どうやって埋めてるかを書いてみる。
これは未就学くらいのタイミングかな。
1〜20までは一応言える。
でも、そこから先の「パターンとしての21〜99」がわからない。
29、30の次は?ってきくと31って言って欲しいのに40って答える
みたいな感じで、100までスムーズに行けない。桁と数字が分かってない感じ。
ここは「そのうち慣れるやろ」と流すと、
後々の数直線・数の感覚・筆算、全部に響くと思ったので、かなりガチめにやってる。
「数の並びを、暗記じゃなくて“景色”として持てるようにする」のが目標で、
ここにだけでも正直、何時間も溶かしてる。
足し算・引き算の繰り上がり/繰り下がりも、
まず数えるときに10の束を作れない。必ず全部数えないとわからなかった。
やり方だけ覚えても、そのうち必ず崩れるのがわかってるので、徹底的に「10の束」からやり直ししてる。
「繰り上がりって何をしてるのか」が腑に落ちるまで前に進ませない感じでやってる。
ここを適当に抜けると、
二桁三桁の計算、
小数の足し引き、
九九も、「覚えが悪いからもうセンスない」で切り捨てると詰むので、
7×8=56なら「7が8こある」図を毎回かいてもらう
暗記が苦手な子ほど、
「意味を伴わない丸暗記」をやらされて折れてる感じがするので、
遅くてもいいから「7×8って、あの長方形ね」くらいにはしておきたい、という方針でやってる。
掛け算・割り算の筆算になると、
ここも、
みたいな感じで、「ノートの上でだけ起きているルール」にしないようにしてる。
よくわからないけど割れば答えが出ると覚えてしまったりして大変だった。
こんな感じで、
一個一個のつまづきに「まあそのうち分かるだろ」でフタをしないで、全部潰しに行ってる。
塾にも通わせてて、算数だけで見ると、
俺自身、こんなに他人の算数を真面目にやったの、人生で初めて。
それだけやっても、塾では一番下のクラス。
じゃあ無駄なのかというと、そうでもない。
点数にはまだ反映されにくいけど、
「理解の速度」と「わからないと言うまでの粘り」は明らかに変わってきた。
塾的にはまだ「一番下のクラスでギリついてきてる子」かもしれないけど、
隣に座って見ている親としては、
石ころをヤスリで削るみたいなスピードで、ちゃんと変化はしているのがわかる。
と、
「20点〜40点ゾーン=もう詰み」ではない世界線も、ギリ存在するんじゃないか、
というのが、今のところの実感。
勉強以外の得意なこと・好きになれそうなことも、もちろん別で探してる。
ただ、
と言い切るには、まだ早い気もしていて。
塾の先生側から見た「これは相当厳しいよ」というリアルも大事だし、
そのうえで、「積み上げを本気でやり直してる親子もいる」という現場目線も、どこかに残しておきたかった。
これを書いてる俺自身も、
「諦めなければ、もしかしたらなんとかなるかもしれない」