はてなキーワード: フェルミ推定とは
一般的に成り立つことが期待される法則が定式化可能でその法則を未知のことにあてはめて(比例関係などは成り立つ前提で)求めたいものも数値ならフェルミ推定
定式化はできない法則で、求めることが可能性の高い低い(具体的なパーセンテージでなく)といったような定性的なことことならそうではない
フェルミ推定以前の話の組み立てミスってるやつが「あんま関係ないかもだけどフェルミ推定とか苦手そうだなお前」なんて書いてるの相当オモロイだろ笑
今のお前は病人で頭が相当悪そうだけど、当時は頭良かったんだな、それはわかったわ笑
お前が頭良いだけの話なら、普通以下の人たちは普通以下なりに仕事してるだけだろうけど、頭が相当壊れたお前にはそこら辺の推論が建てられないんだろうな、かわいそうに。
この投稿者が実際に存在する確率をフェルミ推定で考えると、以下のような仮定を置いて計算できます。
### 仮定
- SNSや掲示板に投稿する習慣がある人(全体の5%と仮定)。
- 書き方やテーマの独特さから、投稿者の個性が見られるため、類似の文章を書く人はさらに1%程度。
1. **まず全体の分母を絞る**:
- 日本の人口(1億2500万)×インターネット利用者(80%)=約1億人。
- ラブホテル利用経験+マッチングアプリ利用者:約10%(両方の条件を掛け合わせ)。
- 上記条件をすべて満たし、独特な投稿を行う人の割合:1億人×1.7%×10%×5%×1% ≈850人。
### 確率の例え
投稿者が存在する確率を「約850人の可能性がある」と考えると、 **「日本全国で1万人に0.68人くらいはこの投稿者のような人が存在する」と言えます**。
この投稿をした人が「存在する確率」をフェルミ推定で考えるとしましょう。このような物語風の投稿は共感を呼びやすく、一定の普遍性を持っています。したがって、この投稿が創作である可能性もありますが、現実に似たような経験を持つ親が投稿したと仮定して考えます。
### フェルミ推定の手順
- 日本の中学生の数は約300万人とします(学年ごとに約100万人)。
- その親の数は、平均的な家庭で2人と仮定すると、600万人。
- クリスマスに何らかの感情やイベントを投稿する親は、全体の10%程度と仮定。
- 中学2年生くらいになると、子どもがサンタを信じなくなる家庭は7割程度と仮定。
4. **このような感情的なエピソードをインターネットに投稿する親の割合**
- 自分の感情や家族のエピソードを文章として投稿する親は、さらに10%と仮定。
計算すると:
\[ 600万人 \times 0.1 \times 0.7 \times 0.1 = 42,000人 \]
つまり、約4万人程度がこのような内容を投稿する可能性があると推定できます。この投稿者が存在する確率は非常に高いといえます。
4万人という数は、東京ドームの満員収容人数(約4.5万人)とほぼ同じです。この投稿をした人が「存在する確率」は、東京ドームに満員の観客がいる中から1人を見つけるような感覚です。つまり、十分にあり得る出来事と言えるでしょう。
この投稿を行った人が実在する確率をフェルミ推定で考える際、次の要素を考慮します。
1. **投稿内容の詳細性**
投稿は非常に具体的であり、登場人物のプロフィールや背景、関係性、発言などが丁寧に描写されています。このような具体的な投稿を作成するには、少なくとも創作か実話に基づいている必要があります。
匿名性のあるインターネット掲示板では、多くの人が日常の悩みや経験を共有しています。この投稿も典型的な相談内容として分類できます。
日本の人口や、同じような境遇の人(27歳、工学系、年収500万以下の男性)が存在する確率を考えると、類似する背景を持つ人物は現実に存在する可能性が高いです。
---
### フェルミ推定で考える手順
---
### 確率の例え
したがって、この投稿をした人が実在する確率はかなり高いものの、特定の背景やエピソードを持つ人としての希少性を考慮すると、「ある海辺の砂浜で特定の小石を探し当てる確率」に近いかもしれません。砂浜全体を日本の人口に見立て、その中に埋もれる小石の1つとして、この投稿者をイメージすることができます。
以下の文章は、インターネット上のある人の投稿です。この投稿をした人が存在する確率をフェルミ推定で考えてください。また、その確率を何かに例えて教えて下さい。
「嘘松かな?」と思ったら
投稿に「これ本当か?」と思ったとき。一人で遊んでいることがある。
1.ChatGPT(他のAIでも可)に嘘松疑惑の文章をコピペする。
2.「この文章は、インターネット上のある人の投稿です。この投稿をした人が存在する確率をフェルミ推定で考えてください。また、その確率を何かに例えて教えて下さい。」
4.そんな希少な人がわざわざ投稿してくれるなんてありがたいなあと思う。
フェルミ推定を用いて、この投稿をした人が「実際に存在する確率」を考えてみます。
---
### **前提条件の設定**
世界中でインターネットを利用している人は約50億人とします。
2. **投稿内容の特異性**
この投稿内容(ChatGPTやAIを使ってフェルミ推定で「嘘松」を考える遊び)がかなりニッチであると仮定します。
ニッチ度を仮定して、これを実行するインターネットユーザーの割合を 1/10,000 (0.01%) とします。
ニッチな趣味を持っていても、その趣味をインターネット上に投稿する人はさらに限定されると考えます。これを 1/100 (1%) とします。
---
### **計算**
存在する確率 = インターネット利用者数 × ニッチ度 × 投稿する割合
\[
50億 \times \frac{1}{10,000} \times \frac{1}{100} = 50,000
\]
つまり、この投稿をしたような人は **50,000人** 存在すると推定されます。
---
### **確率の例え**
50,000人という数は、地球全体の人口約80億人に対して **1/160,000** です。
これを例えるなら、**1回のルーレットで特定の1つの数字に当たる確率(1/37)を約4,300回連続で外すくらいのレア度**です。ただし、インターネット上の広い世界では十分に存在する確率といえます!
---
結論として、この投稿をした人が存在する確率は低く感じられるかもしれませんが、実際には現実的に存在する可能性があります。その希少性に感謝する気持ちもわかりますね!
投稿に「これ本当か?」と思ったとき。一人で遊んでいることがある。
1.ChatGPT(他のAIでも可)に嘘松疑惑の文章をコピペする。
2.「この文章は、インターネット上のある人の投稿です。この投稿をした人が存在する確率をフェルミ推定で考えてください。また、その確率を何かに例えて教えて下さい。」
4.そんな希少な人がわざわざ投稿してくれるなんてありがたいなあと思う。
参考:
https://anond.hatelabo.jp/20241222004847
約0.00004%
数百万回のスロットマシンでジャックポットを2連続で当てる確率
https://anond.hatelabo.jp/20241222142408
約0.000002%
白人の間では、日本人の女には「ピカチュー」とか言っとけばなぜかやれるとされている。
EUにも弱男はいて、当然結婚はできないのだが、そんな時目の前を日本人の女たち(卒業旅行なんだろう)が通りかかるとする。EU弱男の口をついて出た言葉が「ピカチュー」だった。程なくして日本人の女たちのひとりとEU弱男は結婚を果たし、周りにはオリエンタルミラクル(ダッチワイフの奇跡)ともてはやされた。こんなシチュエーションが、人口5億の地域で、年間2000回生じることは、それほど想像に難くない。日本の人口で考えたら、400回ってところだ。目の前を歩くペロペロキャンディを、腹を空かせたワニが一応味見してみることが年間400回起こらないと思うかい?2000は十分ありそげな数字だ。
就活関連でバカにされやすいフェルミ推定だが、俺のやってる仕事ではフェルミ推定的な考え方は毎日のようにする。というか、仕事そのものがフェルミ推定のようなものである。
やってる業務は社内での新規システムの導入みたいなことで、トラブルの調査から追加機能の開発検討までやってる。何かを調べる,準備するということの中に完全な定型業務のようなものがあんまりない。予算や人は追加でつけてくれたりするが、スピードを求められる。
こういう環境の中で「これをああした時に、いくらぐらいのコストメリットが生じるか、障害のリスクがどんだけか」みたいなことを見積もる時に使うのがフェルミ推定である。
こういう状況において、過去の事例からの類推で調査を始めようとする人も多い。たぶん、そういう人は過去の仕事の仕方がそういうやり方だったんじゃないかな、と思う。
そんなに難しいテクニックではないが、苦手な人は決定的に苦手なので、特定の業界が入社選抜に用いているというのは個人的には納得感が高い。
何かと話題のひまそらあかね東京都知事候補者の得票数を、一ウォッチャーとして認知プロファイル元いフェルミ推定してみようと思う。
まず、氏は選挙活動のほとんどをX(Twitter)とYouTubeで行っているため、「氏のX(Twitter)もYouTubeチャンネルもフォローしていないが、投票だけはする」という人物像がほとんど想像できない。
ここを出発点とする。
(この前提が間違えているかどうかは、支持者らによる"草の根応援活動"にかかっているわけだ。ぜひ頑張ってもらいたい)
今現在の氏のX(Twitter)のフォロワー数は「29.7万」、YouTubeチャンネルは「20.7万」だ。
当然どちらもフォローしている人も多いし、一人で複数アカウントをフォローしている人も居るだろうから、ここではフォロワー数は合計「40万人」としておこう。
氏本人の発言だか関係者の発言だったかは忘れたが、氏のチャンネルの視聴者数は「30代~50代男性」が圧倒的に多いらしい。
なので「40万人」のフォロワーは、全員「30代~50代男性」と仮定する。
https://www.stat.go.jp/data/jinsui/pdf/202406.pdf
https://www.toukei.metro.tokyo.lg.jp/juukiy/2024/jy24q10701.htm
(余談として、日本全人口に占める東京都民の割合を計算すると約"11%"となった。つまり東京都には30代~50代男性がより多く集まっているということだ)
氏のフォロワー「40万人」の内の都民の割合は、上で計算した割合がそのままあてはまるものとする。
40万人×12.4%=4.96万人
となる。
https://www.senkyo.metro.tokyo.lg.jp/election/nendaibetuchousa/tochiji-nendaibetu2014/
30代~50代男性の投票率を計算すると「約53%」となった。
今回は期日前投票の数が前回より多く、投票率はやや高めになりそうな雰囲気らしいので、5%多めに見て投票率は「58%」としよう。
※また余談だが、筆者は上記のグラフを見るまで、男女の投票率にこんなに差がある(女性の方が投票率高い)とは思っていなかった。これは氏によっては不利な事実となるだろう。やはり女性人気を得ないと選挙では勝てないのだ。
氏のフォロワー内の有権者のうち、投票に行く人の割合も「58%」と仮定する。
4.96万人×58%=2.88万人
となる。
最後に、この「投票に行く人」のうち、ひまそらあかね候補に投票する人の割合はどれくらいか。
当然「フォローはしてるけど投票するのは別の人だよ」という人も多く居るだろう。
X(Twitter)の雰囲気を見るに、確かに支持者の間での盛り上がりは強く感じられる。
よってかなり好意的に考えて、氏へ投票する割合は「75%」としよう。
投票数は
2.88万人×75%=2.16万票
となる。
その他として、前回・前々回の都知事選結果を見るに、何者なのかなんだかよく分からない人でも3000票ぐらい取ってたりする。
多分立候補した時点で、なんだかよく分からないが3000人ぐらいは投票してくれるっぽい。
この3000票も足しておこう。
さらに、支持者による熱心な勧誘の成果として「氏をフォローはしてないが投票はしてあげよう」となった人も多少は居るであろう。
500人ぐらいだろうか。
(最初にも言ったが、支持者らの"草の根応援活動"いかんでこの数字は全然変わるであろう。ぜひ頑張ってもらいたい)
2.16万票+3000票+500票≒約2万5000票
という結論となった。
私たちは今、基本的に人間のように会話できるマシンを手にしている。これが普通に思えるのは、人間の適応能力の驚くべき証であり、私たちは進歩のペースに慣れてしまったのだ。しかし、ここ数年の進歩を振り返ってみる価値はある。
GPT-4までのわずか4年間(!)で、私たちがどれほど進歩したかを思い出してほしい。
GPT-2(2019年)~未就学児:"わあ、もっともらしい文章をいくつかつなげられるようになった"アンデス山脈のユニコーンについての半まとまりの物語という、とてもさくらんぼのような例文が生成され、当時は信じられないほど印象的だった。しかしGPT-2は、つまずくことなく5まで数えるのがやっとだった。記事を要約するときは、記事からランダムに3つの文章を選択するよりもかろうじて上回った。
当時、GPT-2が印象的だった例をいくつか挙げてみよう。左:GPT-2は極めて基本的な読解問題ではまあまあの結果を出している。右:選び抜かれたサンプル(10回試したうちのベスト)では、GPT-2は南北戦争についてある程度関連性のあることを述べた、半ば首尾一貫した段落を書くことができる。
https://situational-awareness.ai/wp-content/uploads/2024/06/gpt2_examples-1024x493.png
当時、GPT-2について人々が印象に残った例をいくつか挙げます。左: GPT-2は極めて基本的な読解問題でまあまあの仕事をする。右: 厳選されたサンプル(10回試したうちのベスト)では、GPT-2は南北戦争について少し関連性のあることを言う、半ば首尾一貫したパラグラフを書くことができる。
AIの能力と人間の知能を比較するのは難しく、欠陥もあるが、たとえそれが非常に不完全なものであったとしても、ここでその例えを考えることは有益だと思う。GPT-2は、その言語能力と、時折半まとまりの段落を生成したり、時折単純な事実の質問に正しく答えたりする能力で衝撃を与えた。未就学児にとっては感動的だっただろう。
GPT-3(2020年)~小学生:"ワオ、いくつかの例だけで、簡単な便利なタスクができるんだ。"複数の段落に一貫性を持たせることができるようになり、文法を修正したり、ごく基本的な計算ができるようになった。例えば、GPT-3はSEOやマーケティング用の簡単なコピーを生成することができた。
https://situational-awareness.ai/wp-content/uploads/2024/06/gpt3_examples-1.png
GPT-3について、当時の人々が印象に残った例をいくつか挙げてみよう。上:簡単な指示の後、GPT-3は新しい文の中で作られた単語を使うことができる。左下:GPT-3は豊かなストーリーテリングを行ったり来たりできる。右下:GPT-3は非常に簡単なコードを生成できる。
GPT-3はSEOやマーケティング用の簡単なコピーを生成することができた。上:簡単な指示の後、GPT-3は新しい文章の中で作られた単語を使うことができる。左下:GPT-3は豊かなストーリーテリングを行ったり来たりできる。右下:GPT-3は非常に簡単なコードを生成できる。
繰り返しになるが、この比較は不完全である。しかし、GPT-3が人々に感銘を与えたのは、おそらく小学生にとって印象的だったことだろう。基本的な詩を書いたり、より豊かで首尾一貫した物語を語ったり、初歩的なコーディングを始めたり、簡単な指示やデモンストレーションからかなり確実に学習したり、などなど。
GPT-4(2023年)~賢い高校生:「かなり洗練されたコードを書くことができ、デバッグを繰り返し、複雑なテーマについて知的で洗練された文章を書くことができ、難しい高校生の競技数学を推論することができ、どんなテストでも大多数の高校生に勝っている。コードから数学、フェルミ推定まで、考え、推論することができる。GPT-4は、コードを書く手伝いから草稿の修正まで、今や私の日常業務に役立っている。
https://situational-awareness.ai/wp-content/uploads/2024/06/gpt4_examples-3.png
GPT-4がリリースされた当時、人々がGPT-4に感銘を受けた点をいくつか紹介しよう。上:GPT-4は非常に複雑なコードを書くことができ(中央のプロットを作成)、非自明な数学の問題を推論することができる。左下:AP数学の問題を解く。右下:かなり複雑なコーディング問題を解いている。GPT-4の能力に関する調査からの興味深い抜粋はこちら。
AP試験からSATに至るまで、GPT-4は大多数の高校生よりも良いスコアを出している。
もちろん、GPT-4でもまだ多少ばらつきがある。ある課題では賢い高校生よりはるかに優れているが、別の課題ではまだできないこともある。とはいえ、これらの限界のほとんどは、後で詳しく説明するように、モデルがまだ不自由であることが明らかなことに起因していると私は考えがちだ。たとえモデルがまだ人為的な制約を受けていたとしても、生のインテリジェンスは(ほとんど)そこにある。
https://situational-awareness.ai/wp-content/uploads/2024/06/timeline-1024x354.png
続き I.GPT-4からAGIへ:OOMを数える (3) https://anond.hatelabo.jp/20240605204704