このブログの更新は Twitterアカウント @m_hiyama で通知されます。
Follow @m_hiyama

メールでのご連絡は hiyama{at}chimaira{dot}org まで。

はじめてのメールはスパムと判定されることがあります。最初は、信頼されているドメインから差し障りのない文面を送っていただけると、スパムと判定されにくいと思います。

[参照用 記事]

「確率変数」と言うのはやめよう

カーク・スターツ(Kirk Sturtz)という人が、なにやら圏論ベースの確率論をやっています。スターツのarXiv論文リストをたどって、アブストラクトと第1節を拾い読みしてみると、「『確率変数』という言葉は使わない」という記述がありました*1。

なるほど。共感・同意します。

謎すぎた「確率変数」

僕が確率を嫌がっていた理由のひとつは、この「確率変数」という言葉の尋常じゃない謎さかげんです。まったく意味不明で、やる気を失いました。

僕、普通の確率論なーんにも知らんわ。高校の教科書に確率もあったのですが、「確率変数」の定義があまりに意味不明で、それ以来毛嫌いしているのでした。

かなりシッカリした内容の教科書でも、「確率変数とは、値がハッキリとは決めることができない変数です」みたいな“定義”から始まります。

「確率変数」を使わないなら何と呼べばいいのか? 「可測写像」です。可測写像を定義するには、可測空間の概念が必要ですが、離散可測空間だけ考えるなら、任意の写像が可測写像になるので、可測写像の代わりに「写像」でもかまいません。離散可測空間(単なる集合)なんて役に立たないのではないか? そうでもありません。入門の素材は十分に提供可能です。

可測写像には、曖昧な点もミステリアスな点もありません。いたってドライです。「確率変数」を機械的に「可測写像」に置き換えて、それで意味がハッキリするときもあれば、余計にワケわからなくなるときもあります。「可測写像」に置換して不適切なところは、なにか別な意味で「確率変数」を使っていたことになります。

「確率変数」を可測写像以外の意味で使ったり、文脈に依存したニュアンスを持たせようとしているわけです。もともとが意味不明な言葉に、さらに多義性や文脈依存性を持たせて使われたのでは、たまったもんじゃありません。

ニュアンスや曖昧性

可測写像は、集合A、Bに対する x:A→B のような写像です。xに条件が付きますが、写像であることは間違いありません。特に確率変数と呼びたいのは、Bが実数であることを強調したいのかもしれません。それならば、x:A→R と書けばいいし、R値可測写像と呼べばいいだけです。値の空間が他の特別な集合のときも同じです。x:A→{0, 1} とか明示的に書けばいいし、そのほうが事情がハッキリします。

値の空間をなんとなく「確率変数」と呼んでいる例もあります。気持ちの上では、なにかAがあって、x:A→R を考えたいけど、実はAがなくて、Rだけのときがあります。確率変数xの分布とは、単にR上の分布だったりします。

今出てきた「分布」も厄介な言葉です。スターツの用法を見ると、「分布」を禁止はしてませんが、分布と測度を同義語として使っているようです。「分布」も「測度」に置換したほうがいいんじゃないかと僕は思います。それで変だったら、暗黙の(伝達と理解が困難な)ニュアンスを持ち込んでいるはずです。

「分布」のよくある使用例は、A上の測度μを、可測写像 x:A→B により前送りした測度 x*(μ) を「分布」と呼ぶ例です。この状況なら「像測度(image measure)」または「前送り測度(pushforward measure)」と呼べば意味がハッキリします。「像」や「前送り」を付けたくないキモチは、だんだんAをフェードアウトさせてB上の議論をしたい、ってのがあるかも知れません。それなら、「Aはもう考えない」とキッパリと宣言したほうがスッキリします。

「値がハッキリとは決めることができない変数」なんて“定義”を採用するのは、できるだけ準備を少なくして、実例や計算法を早く説明するための方便でしょう。それがふさわしいときもあるでしょうが、伝統・習慣として定着し過ぎですよ。アンチ伝統として、「確率変数」という言葉を禁止する、ついでに「分布」も禁止する(「測度」を使う)くらいの試みがあったほうがいいと思いますね。

*1:https://arxiv.org/pdf/1312.1445.pdf の "1 Introduction" p.5 に we avoid the use of the terminology of 'random variables' と書いてあります。