noteに行く

noteに移行します。

note.com

何年か前に移行しようとした時、エディターが好みでは無い感じだったので止めたのですが、そろそろかなと思って再び試した所、なかなか良さそうだったので、実行する事にしました。

もともとアクセス数の多いブログではありませんが、はてなとnoteではユーザー層も違うでしょうし、何かしらの変化があるのかも知れません。どうなのでしょう。私の書く内容は、はてな向き、noteでは特殊という印象がありますが、単なる先入観でしょうか。

しばらくは、はてなに書いたものを適当に移していく予定です。エクスポート/インポート も考えましたが、色々崩れそうなので諦めました。

最初の記事としてアップしたのは↓

note.com

ここ最近でもまあまあ良く書けたかな、と思っているもので、昔から論じてきたニセ科学にも関連し、この人の文を手本にしてきたという一人である中谷博士に言及・引用した文章なので、選びました。

ブログ執筆の期間としては、結構長くやってきているほうだと思います。ココログの頃から数えると、もう19年目くらいですか。以前から読んでくださっているかたもいらっしゃると思いますが、ありがたい事です。これからも、よろしくお願いいたします。

身長なる確率変数

たとえば,まだ会っていない人の身長に関心があるという場合,身長は実数値をとるから,Xを身長の空間として,X=R,あるいは負の値はとらないからX=[0,∞)とするのもよい.そして実現とは,その人物の身長を知らされることと考えればわかりやすいが,厳密に言えば,知らされる必要もなく,その人の身長そのものである.

ここです(P38)、ずっと私が違和感を持ち続けている記述は。たとえば統計検定のテキストにも、連続型確率変数の説明で同じような内容が出てきます。

これは、身長を考える時、まず実数の区間を結果空間と設定して、そこから1つの実数が選ばれる、というように考えています。しかるに、私たちが想定しているのは、会う可能性がある人が有する身長なる属性であるはずです。そうであるなら、まず結果空間として考えるのは、抽象化された実数の区間などでは無く、区別のつく人間の集合であるべきではないでしょうか。

身長を測って統計的に評価する事を考えるのはどういうシチュエーションでしょう。通常それは、学校等でおこなわれる身体測定ですね。たくさんの人を集めて、その人に付随する量を限られた桁数で測る、という行為のはずです。更に、身長に限らず、心理学的や社会調査的の観察なり測定なりは結局、人間の集まりを検討対象とする訳です。

そうであれば、検討対象のベースとしての結果空間は、離散的な、人間の集合として捉えるのが自然です。そして、その上に定義された確率変数なる写像を考える時に、選ばれた人と、その人に対し身長測定で与えられた数値、を対応づけるのが整合的です。プロパティ的に書けば、rv(ω)=ω.MeasuredHeight といった具合です。

私たちは、現象を数理的にモデル化してその論理構造を追究していこうと考えています。それが科学的なアプローチです。そうであるなら、まず現象がいかなる構造を持っているか、と捉えて行くのが順序ではないでしょうか。だからこそ、人間の集まりの中からどのように選ぶか、という確率抽出の観点が重視されます。1人の人間が選ばれるというアウトカムを要素とする事象にどう確率を与えるのか。そこで想定されているのはまだ、人間を選択する具体的な現象です。

しかるに、確率・統計の色々の本で、身長は連続型確率変数の例だとして簡単に紹介してあります。なぜそうしているのか、私はずっと解らないでいます。私たちは、人間から人間を選んで身長を測るのであって、実数の中から身長を選ぼうとするのではありませんから。