はてなキーワード: 条件付き確率とは
貴様の自己放尿は、レッテル貼りと論点すり替えを同時にやっている点で、議論としては致命的に弱い。
まず「これ系の理系」という曖昧語で対象をぼかし、「PCカタカタできるだけ」という侮蔑的表現で能力を矮小化しているが、これは主張の内容に一切触れていない。
数学的に正しいかどうかを検討できない人間が、人格類型をでっち上げて安心しようとして自己放尿しているだけだ。
そもそも、ここで問題にしているのは「他分野について専門家面しているか」ではない。
アルゴリズムが入力履歴に基づいてレコメンド分布を更新し、その分布が利用者の情報環境を規定する、という事実だ。
これは経験談でもノリでもなく、確率過程と最適化の話であり、まさに数学の領域だ。
条件付き確率、強化学習、情報エントロピー、これらを知らずにYouTubeやAIを語る方が、よほど誤解を持っている。
数学は内容の格付けをしない。再生数が多いか少ないか、流行っているかどうかには無関心で、構造が正しいか、論理が閉じているか、仮定と結論が整合しているかだけを見る。
高度理論の動画が再生数1桁に留まることは、数学的には何の矛盾もない。
むしろ、対象人口が指数的に小さい分野ほど、期待再生数が低くなるのは自明だ。
ここを理解できずに「ちゃんとしたものは伸びるはず」と言うのは、統計リテラシーの欠如を自白しているに等しい。
また「PCカタカタできるだけ」という表現自体が、数学と計算機科学の関係を根本的に誤解している。
現代のアルゴリズム、機械学習、推薦システムは、線形代数、確率論、最適化理論なしには一行も書けない。
コードは結果であって本体ではない。本体は数式とモデルだ。そこを理解せずに「他分野にも通じているつもりだろ」と揶揄するのは、顕微鏡を覗いたことのない人間が生物学者を「ガラス眺めてるだけ」と言うのと同じ愚かさだ。
結局その反論は、「自分には分からない数学的議論を、態度や人格の問題に落とし込んで無効化したい」という防衛反応でしかない。
数学は冷酷だ。誰の肩書きも、分野横断の印象論も救ってくれない。正しいモデルを立て、正しい推論をし、観測と整合するか、それだけだ。
僕は昨日、午前6時17分に目覚めた。
目覚ましは2種類、アナログ秒針音と周波数の微妙に異なる合成トーンを重ねたものを使う。
起床後の15分間は「視覚のデチューン」ルーチンとして照明を極端に低くし、網膜の適応曲線を意図的に遅延させることで認知の鮮鋭化を増幅する。
朝食は厳密にタンパク質比0.42、炭水化物比0.29、脂質比0.29を狙ったオートミール+卵白+ギリシャヨーグルトで、計量は0.1g単位。コーヒーはブリュワー温度を93.2℃に保つ。
僕の習慣は決して儀式ではなく、情報エントロピーを最小化して日常的なノイズを排するための有限状態機械だと説明する。
ルームメイトが朝から実験用ドライバーでガタガタやっているので、僕は中断せずに黒板の前に立ち、昨日考えていた超弦理論のある断片をノートに落とす作業をした。
今回は徹底的に抽象化した視座から入る。従来の超弦理論的場の位相空間を「1-対象の∞-圏」と見なし、そのモノイド圏的作用を導くことで、従来のモジュライ空間の位相不変量がホモトピー圏論のスペクトル的コホモロジーに帰着するという仮説を立てた。
より具体的には、ラングランズ対応の圏論的アナロジーを用いて、ゲージ群の表現環が導くモチーフ(motive)の圏と、弦の世界面上のファイバー付き代数的スタックの圏とを「導来圏の間の高次同値(a weak equivalence in the (∞,2)-categorical sense)」で結びつける試みだ。
ここで新奇なのは、通常のスペクトル系列ではなく「階層的スペクトル列(a nested spectral sequence indexed by ordinal-type filtrations beyond ω)」を導入して、閉じた遷移の非可換共鳴が量子補正式にどう寄与するかを解析する点である。
ウィッテンでも一瞬眉をひそめるだろうが、それは彼の専門領域を超えた命題の述語論的再編成が含まれているためだ(注:単なる挑発ではなく、証明可能性のための新たな可換図式を準備している)。
昼過ぎ、僕は隣人とほんの短いやり取りをした。彼女は僕のキッチンを通るたびに植物の世話に関する助言を求めるが、僕は葉緑体の光合成効率を説明する際、ついヘテロトロフ的比喩を避けて遺伝子発現の確率過程モデルを持ち出してしまう。
彼女はいつも「もう少し軽い説明はないの?」と呆れるが、僕にとっては現象の最少記述が倫理的義務だ。
午後は友人二人と対局的に遊ぶ約束があって、夕方からは彼らとLANセッションを組んだ。
僕はゲームに対しては容赦がない。昨日はまずThe Legend of Zelda: Breath of the Wildでカジュアルな探索をした。
BotWは開発を担当したNintendo EPDが2017年3月3日にWii UとNintendo Switch向けにリリースした作品で、そのオープンワールド設計が探索と化学的相互作用に重きを置いている点が好きだ(発売日と開発元は参照)。
その後、難度調整のためにFromSoftwareの古典的タイトル群について雑談になり、初代Dark Soulsが2011年にリリースされ、設計哲学として「挑戦することで得られる学習曲線」をゲームメカニクスに組み込んだことを再確認した(初代の年は参照)。
夜遅く、友人たちがスーパーヒーロー系の話題を持ち出したので、僕はInsomniacが手掛けたMarvel's Spider-Manの2018年9月7日発売という事実を引き合いに、ゲームデザインにおけるナラティブとパルス感(ゲームプレイのテンポ)について議論した(発売日は参照)。
ここで重要なのは、ゲームを語るときに物理学の比喩を使わないという僕のルールだ。
ゲームの設計原理は計算的複雑性、ユーザーインタラクションのフィードバックループ、トークン経済(ゲーム内資源の流通)など、情報理論と計算モデルで語るべきであり、物理のアナロジーは曖昧さを持ち込むだけだ。
作者インタビュー、収録順、初出掲載誌、再録時の微小な台詞差異まで注視する癖がある。
昨日はあるヴィンテージの単行本でトーンの変遷を確認し、再版時にトーンカーブが調整された箇所が物語の解釈に如何に影響するかを論じた。
これらは一般的にはオタクにしか響かない情報だが、テクスト解釈の厳密さという点で、僕の思考様式と親和する。
僕の習慣はゲームのプレイにも現れる。セーブは複数スロットを使い、各スロットに「探索」「戦闘」「実験」のタグを人為的に与えておく。
そうすることでメタ的な比較実験が可能になり、ゲーム内意思決定の条件付き確率分布を再現的に評価できる。
友人はこれを無駄と言うが、僕にとってはルーチンと実験設計が同義だ。
夜中、帰宅した後にさらに2時間、論文の草案を書き直した。書き直しは僕の儀式の一部で、ペン先の角度、フォントのカーニング、段落の「情報密度」を計測し、不要語を削ぎ落とす作業だ。
寝る前の最後の行動は、ブラックボックス化した思考経路をメモ化しておくことで、翌朝の「継続的洞察再現性」を保証すること。
結局僕は午前2時3分に就寝した。昨日は量子的洞察の可能性と、ゲームとコミックにおける情報理論的語法の交差点を追求した一日であり、そうした知的遊戯が僕の精神の整列をもたらす。
高次元データの確率分布を扱う場合には分配関数を計算する必要があるけど、この計算はとにかく重たいので現実的に解ける小さな問題に分割する必要がある。
この代表的な手法が自己回帰モデルで、現在主流のLLMはこのタイプになっている。(ちなみに画像生成で有名な拡散モデルを使用する手法が最近注目を集めている。)
まず、自己回帰モデルは高次元データのうち最初の次元の値を生成する。続いてこの生成した値で条件付けをして次の次元の値を生成する。このように、現在まで生成した次元の値で次の次元の値の条件付き確率分布を扱うために「次に来る単語の予測」をしているに過ぎないという表現を用いているのだと思います。
関係ない話するな。お前のしてるのは条件付き確率でそうじゃない確率の話するようなことだ。
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA512 https://anond.hatelabo.jp/20250619152334 -----BEGIN PGP SIGNATURE----- iHUEARYKAB0WIQTEe8eLwpVRSViDKR5wMdsubs4+SAUCaFOs5gAKCRBwMdsubs4+ SCXrAQCxilNQPvo28x+kJ/4HTbB5KBSp7r/VgA+H58pVrQH2ZAEArnbUKAAJXYXU vDMEafuSMTUa8YawVKFceMc6T66+PQA= =irqf -----END PGP SIGNATURE-----
夕食前 84.1キロ 夕食+腐りそうなので残りサニーレタスとプチトマト一パック+ベビーチーズ1本 実就寝時間:01:00
実起床時間:07:00 朝食前 84キロ 朝食は納豆、油揚げ、ごはん、味噌汁、胡麻和え、しゃけ
午前中は尿のみ。うんこはなし。
昼食 水漬けパスタに半額お惣菜のエビの素揚げとホタテと半額だったスイートバジルを追加してオイルで和える
(水漬け10時間+3分茹でだと柔らかすぎだったので今後はもう少し短めに茹でること)
15:30 寝不足で頭がぼんやりしていて重力方向が変。今日は21時までに寝ること。→仕事の残りがあるので変更。
夕食は芋とキノコと玉ねぎと鶏の焼いたやつ と もやしとラディッシュの酢漬け
うんこはまだ出ていない
読書:
測度・確率・ルベーグ積分:40~59Pを行き来。具体的な証明とかは全然わからないのでどっかで手書き必要そう。「そもそも積分する対象といったものを有限加法性を持つかどうかなどで正しく構成しないと色んな不整合が生じるので自分がどんな対象に対して積分したいのかをよく認識してね」といったメッセージは読み取れたが、有限加法性やσ加法族、完備化やルベーグ可測、ルベーグ可測でないといったことがまだ頭の中で宙ぶらりんな状態で正しく事例と結びつかないのでその辺が要確認。
気になった言葉:相落手形、アイオロス(風の操縦者)、アイオワシティー(アイオワ州の州都ではない。州都はデモイン)、愛語摂→四摂事
視聴動画:
https://www.youtube.com/watch?v=DaDxCx2-hDc
https://www.youtube.com/watch?v=jfk42-0meJQ
実起床:7:35、84.3キロ(朝食前)。うんこなし。朝食はにんじん、ソーセージ、ブレッドプディング
11時8分 うんこが出る。少し柔らかそうだったが割合健康的な長うんこ。うんこ後体重は84.4
基本的にはリーマン積分のこれまでの過程をルベーグ積分でやり直してみようの回
最後の条件付き確率については加法族での確率空間の再構成という新しい概念が出ていて新鮮だった
実起床:6:30、84.2(朝食前)。朝食はごはん、納豆、味噌汁
海底二万マイルを少し読み進める。海底の森→潜水艇の日常風景→座礁→パプアの島という感じで冒険のステージが切り替わった感じ
海底二万マイルという言葉自体はまだ全く出ていない。下巻になってから? 不明。
12:30 ニンジン1/2本、蒸しじゃがいものちっちゃいの五個、半額総菜のサバのしょうゆ?煮みたいなやつ
COMIC DAYSとgoogle playの課金機能が動かなくなる。原因不明。
海底二万マイルをパプアで人食い人種が出てくるところまで読了。
0:30就寝
7:00実起床 朝食:ピーナッツバタートーストとソーセージとレタス
18:30 のりまき
読書はキングキラー・クロニクル 風の名前 宿屋の主人との会話まで完了。
腰の痛みで何度も起きてしまった。ポケモンスリープ1日目は1時間半しか寝ていないことに。
10:30に耳鼻咽喉科へ聴力健診。風邪で混んでいたので11:40まで待つ。ルベーグ積分を読み終えてしまったが、内容として読み終えただけで関数などの証明には至っていないのでまだまだ読めそう。内容としては中心極限定理や大数の法則についてを数学的に積分論の言葉を使って書き表す、というもの。一点気になったのは作者は大数の法則について「経験的な法則というだけでなく<しっかりと数学的な証明を持った考え方~」という話をしていたが、どちらかというと経験の方が大事なのではないかと思った。
また食と文化の本についてアジア編とインド編が読了し、アジアは米と魚、インドは(麦と米と)豆とミルク、遊牧文化圏以西は麦とミルク、みたいなまとめまで読んだ。納得できる。
12:30に中華弁当。中身はごはん、味玉、メンチカツ、じゃがいもとえびのあんかけ炒めみたいなもの。最後の料理は食べたことがある気がするが名前は思い出せない。炒土豆絲?
19:00までジム
ルワンダ銀行総裁日記を読了。改めてこれを読んでからルワンダ内戦について確認すると、服部も当時の政権側なのでその色眼鏡が入っているが、RPF側が勝利したので残念な結果だったのかもしれない。特に服部は当時の政権で仲のいい人たちがたくさんいただろうからやはりそれには心を痛めていたのかなという感じ。一方で調べてみるとRPF側が開戦した(ハビャリマナが殺された事件の犯人)というのも正しくはなさそう。
実際その後の難民の挙動はどうだっただろうというのは気になる。
15:00 うんこ
判断というのが確率的な期待値を目標にして何らかの行動を起こすことだとすると、それはn数を稼げる人(警察で対策考える人とか)にしか意味のない考え方
踏んだら一発アウトのケースでは期待値を目指そうとしてもn数が稼げないので結果が収束しない(期待値が得られない確率が上がる)
「n=1の話は意味ない、私のnは50万だ 」みたいなやつ(もう消えた)に対する反論のフォローのつもりだった
n数を稼ぐことはやり直せない事象において個人の確率的な判断に寄与しないという意図
「なんか確率低いからOK」の判断はみんなどこかで線を引いてやってるものだと思うけど、その線の上か下かっていうだけの話だと思う。そこにはそれほど思いはない(追記:主張がないということではなく議論する気はない、しても仕方がないという意図)
(それを確率から判断しているというか確率っぽい数字やその他いろんなものを見て総合的に判断しているというかは人によるのでは?自分はそれは確率的な思考ではないと思う。)
ただ、50万の話は全体の確率であって風呂場で親の目がない場合の条件付き確率は考慮されるべきだとは思う
n数あげると結果が収束するから確率論の予測が当たりやすくなるけど、n数上げられないと収束しなくて確率論が絵に描いた餅になるよ
だからn数上げらんないなら確率とか気にせずに世間でやっちゃいかんとされとることはやらん方がいいよ
っていう感じ
自称優秀な人物はたくさんいるが、本当に優秀な人物は限定される。これは、自称金持ちはいるけど本当の金持ちは少ないのと同じだ。
たとえば優秀なプログラマーを見抜くには、条件を追加していけばよい。
以下はただの例 (状況に合わせて任意に条件が変わると考えてほしい)
面接の場合は知識を偽装できてしまうが、技術試験筆記試験の場合は偽装ができない。偽装できない方法で基礎があるかテストすれば大体はふるい落とせる。
「コンプガチャの条件とはかけはなれていて、コンプガチャに比べてもいっそう悪質だ」と共感のトラバとして受け取った。
つまりコンプガチャではいえば、その9種類以外の24種類が揃っている時点を0回とした、n回目に残り9種類が全て「一つ以上」出ている確率という「条件付き確率」であるということだ。1%で当たりが出るくじを100回引くと6割強当たるというその確率の意味が、100回目までに「一回以上」当たりが出ている確率のことであるということと同じだ。
また2回引くごとにはずれが一つずつ増えていくというのも本文に書いた通りでこれも一般的なコンプガチャとは異なっているところだ。
このような条件において、一体nか月目にはどのぐらいの確率で全種類揃っているのかということが問題なのだ。
あるいは全種類揃えるのに何か月要するのかという期待値が問題なのである。
しかしそもそもこのような期待値は収束するのだろうかというのが問題の核心なのである。
もしもその9か月分もバックナンバーも販売していたら買い手は2万7000円払えば済んでしまう。
しかし作者は故意なのかそこまで確率について悲観的に考えてなかったからなのか知らないが、その9か月分については作者を支援し続けないといけないという方法しかなくしてしまっている。
作者の本心はともかく、これは「ある程度の期間支援を続けていれば全て揃うだろう」という買い手側が陥りがちな希望的観測につけこんでいる。
確かに究極的に運がよければ8か月目に全ての作品が揃うが、確率論の見地ではそもそも「何か月支援すれば全ての作品が揃うのか」という期待値が出るのかすら怪しい仕組みであり、現実的にはこの仕組みにおいては全ての作品が揃うと見込むこと自体に無理があるおそれがある。
つまり本来は2万7000円払えば手に入るものを、買い手側の確率的な事象に対する楽観的な見方に付け込んで、その何倍もの金額を出させるようなことをしているわけである。あるいは現実的には一生揃うことがないような仕組みのなかで金を搾取し続けるような悪魔的仕組みであるおそれもある。
せめて2倍強の5万円分(1年5か月目)には6割以上の割合で揃うという確率論による担保があるような仕組みであるべきではないだろうか。
本来それだけのお金出せば手に入るというところから確率を悪用して、買い手に淡い期待を持たせて本来それだけ払えば手に入る以上のお金を払わせるというのはまさに景表法の範疇にある悪質な商法ではないだろうか。
この件は私の中で2つ仮説がある。
その1(隠れた「条件付き確率」)が説明しやすいけど、個人的にはその2(隠れた「発言者バイアス」)の方だと思っている。
∈仮説その1∋
普通、雨が降ってる日には洗車しない。
そして、晴れた次の日に雨が降る確率は、雨が降った次の日に雨が降る確率より大きいと思われる。
そうすると、洗車した日(=晴れた日)の次の日に雨が降る確率は、通常の雨が降る確率より大きいことになる。
これが『洗車したときに限って雨が降る』印象を与えているのだと思われる。
∈仮説その2∋
『洗車したときに限って雨が降る』の『洗車したとき』は定義が決まっていない。
人によっては、洗車した1週間後に雨が降った場合でも『洗車したときに限って雨が降る』と感じてしまうだろう。
そして、『洗車したときに限って雨が降る』なんて言葉を言う人は、洗車する行為にある程度思い入れがあるはずである(無ければ、そんな一般化したようなことは言わないだろう)。
思い入れがあるのならば、洗車したことに対する記憶も長く保たれるはずである。
つまり、『洗車したときに限って雨が降る』での『洗車したとき』も長めに感じるはずである。
このように、『洗車したときに限って雨が降る』と発言する人は、『洗車したとき』で想定する期間を無意識のうちに広めにとってしまうことが、『洗車したときに限って雨が降る』印象を与えているのだと思われる。