「血液型と性格」の正しい理解のために:松井(1991)その2
本エントリは、以下の論文の後半部分を紹介している。
松井豊「血液型による性格の相違に関する統計的検討」、1991、立川短大紀要、24、51-54
以下のエントリと合わせてご覧いただきたい。
「血液型と性格」論文レビューをするにあたって(前々エントリ )
1.はじめに
3. 結果
表4~7は、4年度分それぞれの、各質問項目(表3)ごとの肯定率、及び比率の差の検定結果である。ただし、図が大きいため、ブログ形式ではすぐ下に掲載すると読みづらくなるので、この4つの表については本エントリ末尾に並べておいた。なお読者の便宜のため、表3を本エントリにも掲載しておく。表4~7の左端の列は項目番号を、右端の列は検定結果を示している。検定結果のうち、アスタリスクが一つついているもの(*)は5%有意、二つついているもの(**)は1%有意を示す(*1 )。
さて、有意水準5%で差の見られた項目は、24項目中幾つあるだろうか。
1980年度…3項目
1982年度…3項目
1986年度…4項目
1988年度…4項目
であった。なお、差が有意だった項目数は、24項目のうちおよそ12~17%程度である。完全ランダムであるとすれば、24項目の5%ということで1~2項目程度は(母集団に差がなくても)差が有意になる項目が出ることは当然考えられるため、この程度の項目数が有意になったからと言って、血液型と性格に相関があると判断を下すのは早計である(早計である理由は他にもある。後述)。
では、4年間を通して差が有意だった項目は幾つあるかというと、それは1つしかない(項目番号4)。つまり、他の項目は、たまたまある年度で偶然にも差が有意になってしまった(本当は差がないのに、たまたまそうなるような標本だった)、ということである。24項目のうち1項目しかないのであるから、全項目数における割合は5%以下となった。
わかりやすくするために、表を書き直してみよう。
1位(もっとも「物事にこだわらない」と答えた回答者の割合が多かった血液型)が年度によってバラバラなのがわかるだろう。これでは、差が有意になったと言っても、「血液型と性格」の相関を示すものになっていないということがよくわかるだろう。
なお、肯定率の差も小さく、80年で6.2ポイント、82年が6.1ポイント、86年7.5ポイント、88年9.2ポイント、となっている。この程度の差では、(仮に差が一貫したものであったとしても)日常生活で使えるようなものではないことは明らかだろう。
さて、というわけで、「血液型と性格の間には日常生活で使えるような強い相関はない」ということがわかったと思うが、上の結果はそれ以上の示唆がある。以下では、論文では末尾に「注」としてまとめられていることであり、かなり細かい、かつ詳細な分析ではないことではあるが、大変に示唆的であり面白い結果についてまとめておく。
■この章、これ以降は「注」の内容であり、メインの結論ではない。従って、ここをスキップして「4 考察」に進んでいただいて構わない。興味のある方だけご覧下さい。
一つめは、年度を通して、常にA型が最下位であることである。そこで、データをA型とそれ以外とに再分類し、差の検定を行うと、どの年度でも有意差が認められるとのことである(論文では「表7のデータを…」となっているが、「いずれの年度でも」とあることから、「表4~7のデータを…」の間違いであろう)。ただし、関連係数(ユールのQ)は、大変低く、0.082~0.148ということである。
なお、元論文のこのパラグラフ、すぐ上でも書いたようにタイポ(おそらく)があり、意味がとりづらい。そこで、このパラグラフの一部を引用しておく。
もっとも、上に引用したように、「1項目だけが低い関連しか示していない点を考慮すれば」の意味がまたよくわからない。相関がない方が値が低いので、ここはおそらく「1項目しか高い関連を示していない点を考慮すれば」の間違いではないかと思われる。あるいは、「24項目もあるうち、たった1項目だけに有意な差が認められたが、その1項目でさえ、関連は低い」ということか。
2つ目は、この連関係数(ユールのQ)が、年を追うごとに増加しているということである。論文に挙げられている数値を出しておくと、
0.082→0.095→0.148→0.144
となっている(1986年から1988年にかけては若干減少しているが)。自分でもざっと計算してみたが、最後の桁が1程度ずれただけで、ほぼ再現した。これを、表8の数値と合わせて解釈してみる。まず、どの血液型も、後の年度になるにつれて、「物事にこだわらない」を肯定する率が増える傾向があることに注意する必要がある。つまり、血液型に関係なく、日本人全体として「物事にこだわらない」(少なくとも自分では自分のことをそう思っている)人が増えている、ということである。次に、連関係数の上昇の意味であるが、これは、A型における肯定率の上昇率よりも、非A型における上昇率の方が大きい、つまり非A型はえらい勢いで「物事にこだわらな」くなっている、ということを意味する。このことは、日本人全体の傾向として「物事にこだわらな」くなっているけれども、A型は「こだわる」性格なのであるという知識汚染により、自らを「こだわらないことはない」性格であると規定してしまう傾向がある(こだわらなくなる方向にたいして一定のブレーキがかけられている)ということを示唆している。
この論文では、これを「予言の自己充足現象(self-fulfilling-prophesy)」が進行している可能性の示唆であるとしている。いわゆる「自己成就予言」であろう。
この2つ目の論点は重要で、これが山崎-坂元論文につながっていくのだが、それはまた別の機会に譲る。
4. 考察
本論文では、全国から多段層化無作為抽出した延べ10,000名の調査結果を基にして(論文では「層化」が入っているが、どう「層化」された抽出なのかは不明)、血液型と性格との関連を分析した。
以上より、血液型ステレオタイプは妥当性を欠く、と結論される。
*1 ) 表4の項目4は、χ2=9.639で**、つまりP<0.01だ、となっている。ところが、自由度3の場合、P<0.01になるためには、χ2>11.34でないといけないはずなのだが(少なくとも私が持っている教科書の表では)、よくわからない。P<0.05のためにはχ2>7.81 なので、それは満たしている。同様の理由で、項目14も、P<0.01ではなくP<0.05ではないかと思うのだが。
念のため、表4の項目4についてのみ、χ2を計算してみた。方法は、各血液型ごとに、人数×肯定率と人数×(1-肯定率)を計算し、4×2のマトリックスを作る(数値は丸めて整数にする。人数なので)。あとは通常の(おそらく、通常の)χ2を求める方法で計算する。実際に表4に書かれている9.639に丸め誤差の範囲で一致した。この方法を取る以上、自由度3であることは明白なので、自由度3のχ2分布を見ると、これはP<0.01ではない(P<0.05ではある)。
この計算が正しいとすると、表4の項目4、項目14は**ではなく*、つまりP<0.01ではなくP<0.05と修正されなければならない。他の年度については、χ2の値を信じる限り、アスタリスクの数は正しく付けられている。
***
以上が松井(1991)の内容である。コンンパクトかつ簡潔な論文であり、実に力強い印象を与える。
ABO FAN氏のウェブページを見ると、なんとか誤差の範囲ということにして、相関があるという結論を維持するのに必死であることが窺える(ABO FAN氏が「タイプIIエラー」にこだわるのも理解できよう)。しかし、当然ながら、そもそも相関があるとは言えない、という結論が出ているのである。帰無仮説が棄却できていない。この状態でどんなに誤差の議論をしても-それ自体は重要なことではあるが-そこから血液型と性格に相関があるなどという結論に持っていくことが不可能なのは、統計学の心を理解していればすぐにわかることであろう。
本論文に出てくる計算をすべてフォローしているわけではないことは御了解いただきたい。チェックした一部については本文に明記した。本来ならば、すべての数値について再解析して報告すべきであろうが(血液型と性格に興味を持つ、心理学を学ぶ大学院生ならそうすべきだ!)、そこはご容赦願いたい。
JNNの調査は現在でも行われており、自己成就予言が現在の時点でどうなっているかは興味のあるところである(質問項目が同じかどうかは知らないのだが)。続報が待たれるところだ(このすぐ後に出た山崎-坂元論文については、いずれまたご紹介したい)。
私自身は統計そのものにはそれなりに慣れ親しんでいるけれども、検定についてはきちんと体系的に学んだことがない。特に、「ユールのQ」については、この論文で初めて知ったし、それで慌てて計算ができる程度に学んだにすぎない。であるので、その深い理屈や定量的な理解などはまったく不十分なままであり、表面をなぞるだけの報告になってしまった。フォローしていただければ幸いである。
今回のレビューでは、表をあえてスキャンしたものを載せた。そのため若干見にくくなってしまったかもしれないが、本物の息吹を少しでも皆さんと共有したいとの思いからである。血液型性格判断批判の資料として役立てていただければ幸甚である。
松井豊「血液型による性格の相違に関する統計的検討」、1991、立川短大紀要、24、51-54
以下のエントリと合わせてご覧いただきたい。
「血液型と性格」論文レビューをするにあたって(前々エントリ )
1.はじめに
3. 結果
表4~7は、4年度分それぞれの、各質問項目(表3)ごとの肯定率、及び比率の差の検定結果である。ただし、図が大きいため、ブログ形式ではすぐ下に掲載すると読みづらくなるので、この4つの表については本エントリ末尾に並べておいた。なお読者の便宜のため、表3を本エントリにも掲載しておく。表4~7の左端の列は項目番号を、右端の列は検定結果を示している。検定結果のうち、アスタリスクが一つついているもの(*)は5%有意、二つついているもの(**)は1%有意を示す(*1 )。
さて、有意水準5%で差の見られた項目は、24項目中幾つあるだろうか。
1980年度…3項目
1982年度…3項目
1986年度…4項目
1988年度…4項目
であった。なお、差が有意だった項目数は、24項目のうちおよそ12~17%程度である。完全ランダムであるとすれば、24項目の5%ということで1~2項目程度は(母集団に差がなくても)差が有意になる項目が出ることは当然考えられるため、この程度の項目数が有意になったからと言って、血液型と性格に相関があると判断を下すのは早計である(早計である理由は他にもある。後述)。
では、4年間を通して差が有意だった項目は幾つあるかというと、それは1つしかない(項目番号4)。つまり、他の項目は、たまたまある年度で偶然にも差が有意になってしまった(本当は差がないのに、たまたまそうなるような標本だった)、ということである。24項目のうち1項目しかないのであるから、全項目数における割合は5%以下となった。
さらに、全年度で差が有意となった項目番号4(「物事にこだわらない」)の結果の詳細を見てみよう。表8は、各年度ごと、各血液型ごとの肯定率を示す。すると、最も肯定率の高い血液型は、年度によって異なっていることがわかる。

わかりやすくするために、表を書き直してみよう。
年度 | 1位 | 2位 | 3位 | 4位 |
1980 | B | AB | O | A |
1982 | O | AB | B | A |
1986 | AB | O | B | A |
1988 | B | O | AB | A |
なお、肯定率の差も小さく、80年で6.2ポイント、82年が6.1ポイント、86年7.5ポイント、88年9.2ポイント、となっている。この程度の差では、(仮に差が一貫したものであったとしても)日常生活で使えるようなものではないことは明らかだろう。
さて、というわけで、「血液型と性格の間には日常生活で使えるような強い相関はない」ということがわかったと思うが、上の結果はそれ以上の示唆がある。以下では、論文では末尾に「注」としてまとめられていることであり、かなり細かい、かつ詳細な分析ではないことではあるが、大変に示唆的であり面白い結果についてまとめておく。
■この章、これ以降は「注」の内容であり、メインの結論ではない。従って、ここをスキップして「4 考察」に進んでいただいて構わない。興味のある方だけご覧下さい。
一つめは、年度を通して、常にA型が最下位であることである。そこで、データをA型とそれ以外とに再分類し、差の検定を行うと、どの年度でも有意差が認められるとのことである(論文では「表7のデータを…」となっているが、「いずれの年度でも」とあることから、「表4~7のデータを…」の間違いであろう)。ただし、関連係数(ユールのQ)は、大変低く、0.082~0.148ということである。
なお、元論文のこのパラグラフ、すぐ上でも書いたようにタイポ(おそらく)があり、意味がとりづらい。そこで、このパラグラフの一部を引用しておく。
…表7 のデータをA型とその他の型に再分類し、差の検定を行うと、いずれの年度でも有意差が認められる。しかし、この検定における関連係数(ユールのQ)は0.082~0.148と低めである。分析された24項目のうち、1項目だけが低い関連しか示していない点を考慮すれば、本報告の結論を改変する必要はないと考えられる。よくわからないのが、24項目すべてを再分類して解析しなおしたのか、この項目4のみを解析しただけなのか、である。そこで、表7(1988年)の項目4についてのユールのQを求めてみる。各血液型の人数はわかっているので、項目4に対する非A型の肯定率を求めることができ、それは42,8%となる。A型の肯定率は35.9%なので、A-非Aと、「当てはまる」-非「当てはまる」(1-肯定率で計算した)でざっとユールのQを求めてみると、およそ0.145、同様に表4(1980年)で求めると0.083となったので、各年度ごとに項目4について計算したのだろうと推測できる。
もっとも、上に引用したように、「1項目だけが低い関連しか示していない点を考慮すれば」の意味がまたよくわからない。相関がない方が値が低いので、ここはおそらく「1項目しか高い関連を示していない点を考慮すれば」の間違いではないかと思われる。あるいは、「24項目もあるうち、たった1項目だけに有意な差が認められたが、その1項目でさえ、関連は低い」ということか。
2つ目は、この連関係数(ユールのQ)が、年を追うごとに増加しているということである。論文に挙げられている数値を出しておくと、
0.082→0.095→0.148→0.144
となっている(1986年から1988年にかけては若干減少しているが)。自分でもざっと計算してみたが、最後の桁が1程度ずれただけで、ほぼ再現した。これを、表8の数値と合わせて解釈してみる。まず、どの血液型も、後の年度になるにつれて、「物事にこだわらない」を肯定する率が増える傾向があることに注意する必要がある。つまり、血液型に関係なく、日本人全体として「物事にこだわらない」(少なくとも自分では自分のことをそう思っている)人が増えている、ということである。次に、連関係数の上昇の意味であるが、これは、A型における肯定率の上昇率よりも、非A型における上昇率の方が大きい、つまり非A型はえらい勢いで「物事にこだわらな」くなっている、ということを意味する。このことは、日本人全体の傾向として「物事にこだわらな」くなっているけれども、A型は「こだわる」性格なのであるという知識汚染により、自らを「こだわらないことはない」性格であると規定してしまう傾向がある(こだわらなくなる方向にたいして一定のブレーキがかけられている)ということを示唆している。
この論文では、これを「予言の自己充足現象(self-fulfilling-prophesy)」が進行している可能性の示唆であるとしている。いわゆる「自己成就予言」であろう。
この2つ目の論点は重要で、これが山崎-坂元論文につながっていくのだが、それはまた別の機会に譲る。
4. 考察
本論文では、全国から多段層化無作為抽出した延べ10,000名の調査結果を基にして(論文では「層化」が入っているが、どう「層化」された抽出なのかは不明)、血液型と性格との関連を分析した。
- この調査の実施方法・標本抽出法は統計的に十分な信頼性を有していると考えられる。
- 性格に関する24項目への肯定率は、どの年度も3~4項目が血液型別に有意な差を示した。
- しかし、すべての年度で有意であった項目は、1項目しかなかった。
- その1項目も、最高の肯定率を示す血液型が年度によって異なっており、一貫性を欠いていた。
以上より、血液型ステレオタイプは妥当性を欠く、と結論される。




*1 ) 表4の項目4は、χ2=9.639で**、つまりP<0.01だ、となっている。ところが、自由度3の場合、P<0.01になるためには、χ2>11.34でないといけないはずなのだが(少なくとも私が持っている教科書の表では)、よくわからない。P<0.05のためにはχ2>7.81 なので、それは満たしている。同様の理由で、項目14も、P<0.01ではなくP<0.05ではないかと思うのだが。
念のため、表4の項目4についてのみ、χ2を計算してみた。方法は、各血液型ごとに、人数×肯定率と人数×(1-肯定率)を計算し、4×2のマトリックスを作る(数値は丸めて整数にする。人数なので)。あとは通常の(おそらく、通常の)χ2を求める方法で計算する。実際に表4に書かれている9.639に丸め誤差の範囲で一致した。この方法を取る以上、自由度3であることは明白なので、自由度3のχ2分布を見ると、これはP<0.01ではない(P<0.05ではある)。
この計算が正しいとすると、表4の項目4、項目14は**ではなく*、つまりP<0.01ではなくP<0.05と修正されなければならない。他の年度については、χ2の値を信じる限り、アスタリスクの数は正しく付けられている。
***
以上が松井(1991)の内容である。コンンパクトかつ簡潔な論文であり、実に力強い印象を与える。
ABO FAN氏のウェブページを見ると、なんとか誤差の範囲ということにして、相関があるという結論を維持するのに必死であることが窺える(ABO FAN氏が「タイプIIエラー」にこだわるのも理解できよう)。しかし、当然ながら、そもそも相関があるとは言えない、という結論が出ているのである。帰無仮説が棄却できていない。この状態でどんなに誤差の議論をしても-それ自体は重要なことではあるが-そこから血液型と性格に相関があるなどという結論に持っていくことが不可能なのは、統計学の心を理解していればすぐにわかることであろう。
本論文に出てくる計算をすべてフォローしているわけではないことは御了解いただきたい。チェックした一部については本文に明記した。本来ならば、すべての数値について再解析して報告すべきであろうが(血液型と性格に興味を持つ、心理学を学ぶ大学院生ならそうすべきだ!)、そこはご容赦願いたい。
JNNの調査は現在でも行われており、自己成就予言が現在の時点でどうなっているかは興味のあるところである(質問項目が同じかどうかは知らないのだが)。続報が待たれるところだ(このすぐ後に出た山崎-坂元論文については、いずれまたご紹介したい)。
私自身は統計そのものにはそれなりに慣れ親しんでいるけれども、検定についてはきちんと体系的に学んだことがない。特に、「ユールのQ」については、この論文で初めて知ったし、それで慌てて計算ができる程度に学んだにすぎない。であるので、その深い理屈や定量的な理解などはまったく不十分なままであり、表面をなぞるだけの報告になってしまった。フォローしていただければ幸いである。
今回のレビューでは、表をあえてスキャンしたものを載せた。そのため若干見にくくなってしまったかもしれないが、本物の息吹を少しでも皆さんと共有したいとの思いからである。血液型性格判断批判の資料として役立てていただければ幸甚である。