もし40人学級だったら
「世界がもし100人の村だったら」という話がある。
Wikipediaによれば、2001年頃から、ネットで広まった話で、私は見たことはないけれど、これをもとにした本やテレビ番組になったりしている。
世界に飢えている人が何千万人いるというより、100人(つまり自分の周囲として認識できる集団)の中に何人いるということで、世界で起こっていることを身近に感じさせる工夫らしい。
この話が有名になる前から、自治体では、例えば「○○市の1日」(1日に赤ちゃんが何人生まれている)というような形で、市勢を理解してもらおうという工夫がされていたりした。
こういう工夫はそれはそれで良いことだと思うのだけれど、せっかく統計を使うのなら、もっと突っ込んだ使い方もできると思う。
上にあげた例は、単に尺度を変えただけである。そこに出てくる数字はすべて同じ値で除したものである。数字として身近に感じやすくなるかもしれないけれど、新しい情報は何も付け加えられていない。
この記事でタイトルにあげた「40人学級だったら」というのは、それ自体はあたりまえのことだけれども、統計の使い方はずっと凝ったものが考えられるということ。
学校の1クラス40人という集団は、一般人口の40人とは違う。
一般人口の40人だったら、いろんな年齢の人がそこに居るだろう。40人だったら10人ぐらいは高齢者だ。
しかし、40人学級というのは、実は同じ年齢の集団なのである。そこには高齢者は1人もいない。その40人の親の年齢というのは、だいたい似たり寄ったりである。
つまり、一般人口とは異なる偏った集団というわけだ。
どうしてこんなことを考えたかというと、昔は教室で先生が、親・家の仕事はなんですかという質問をすることができたけれど、今はそれが成り立たないという話を聞いたから。今、そういう質問をすると、クラスに何人か、うちは失業中で働いてません、という子供がいるという。
つまり、40人学級だったら、親が失業している子供が何人いるのか、片親の子供が何人いるのか、同じ学校に通う兄弟姉妹がいるのは何人かなど、標準的な40人学級だったら、教師が頭に入れておかなければならない子供の状況(バリエーション)がどのぐらいありそうかという視点で統計を使ってはどうかということである。
多くの統計では、対象の属性ごとに単純集計して発表されるけれど、前述のような統計を出すためには、子供と親・世帯をマッチングさせた状態で集計しなければならない。単純集計後の統計からは出てこない。
国勢調査ならそういう集計ができるはずである。
昨今、ビッグ・データがよく話題になるが、ビッグ・データの活用の基本は、マッチングを基礎としてパターン(グループ)を抽出することであろう。
国あるいは自治体は、そういう分析をする気はないだろうか。
特に、本記事のように、学校教育に役立てようというなら、文部科学省あたりが、問題意識を持って集計プランを作って、実施したらどうだろう。
もちろん、実際の学級の状況は先生が把握するわけだが、それを特殊と見るか、一般と見るか、文部科学省の施策には違いが出てくるのではないだろうか。
集計プランを作れないなら、生データを匿名化して公開するという方法もある。
Wikipediaによれば、2001年頃から、ネットで広まった話で、私は見たことはないけれど、これをもとにした本やテレビ番組になったりしている。
世界に飢えている人が何千万人いるというより、100人(つまり自分の周囲として認識できる集団)の中に何人いるということで、世界で起こっていることを身近に感じさせる工夫らしい。
この話が有名になる前から、自治体では、例えば「○○市の1日」(1日に赤ちゃんが何人生まれている)というような形で、市勢を理解してもらおうという工夫がされていたりした。
こういう工夫はそれはそれで良いことだと思うのだけれど、せっかく統計を使うのなら、もっと突っ込んだ使い方もできると思う。
上にあげた例は、単に尺度を変えただけである。そこに出てくる数字はすべて同じ値で除したものである。数字として身近に感じやすくなるかもしれないけれど、新しい情報は何も付け加えられていない。
この記事でタイトルにあげた「40人学級だったら」というのは、それ自体はあたりまえのことだけれども、統計の使い方はずっと凝ったものが考えられるということ。
学校の1クラス40人という集団は、一般人口の40人とは違う。
一般人口の40人だったら、いろんな年齢の人がそこに居るだろう。40人だったら10人ぐらいは高齢者だ。
しかし、40人学級というのは、実は同じ年齢の集団なのである。そこには高齢者は1人もいない。その40人の親の年齢というのは、だいたい似たり寄ったりである。
つまり、一般人口とは異なる偏った集団というわけだ。
どうしてこんなことを考えたかというと、昔は教室で先生が、親・家の仕事はなんですかという質問をすることができたけれど、今はそれが成り立たないという話を聞いたから。今、そういう質問をすると、クラスに何人か、うちは失業中で働いてません、という子供がいるという。
つまり、40人学級だったら、親が失業している子供が何人いるのか、片親の子供が何人いるのか、同じ学校に通う兄弟姉妹がいるのは何人かなど、標準的な40人学級だったら、教師が頭に入れておかなければならない子供の状況(バリエーション)がどのぐらいありそうかという視点で統計を使ってはどうかということである。
多くの統計では、対象の属性ごとに単純集計して発表されるけれど、前述のような統計を出すためには、子供と親・世帯をマッチングさせた状態で集計しなければならない。単純集計後の統計からは出てこない。
国勢調査ならそういう集計ができるはずである。
昨今、ビッグ・データがよく話題になるが、ビッグ・データの活用の基本は、マッチングを基礎としてパターン(グループ)を抽出することであろう。
国あるいは自治体は、そういう分析をする気はないだろうか。
特に、本記事のように、学校教育に役立てようというなら、文部科学省あたりが、問題意識を持って集計プランを作って、実施したらどうだろう。
もちろん、実際の学級の状況は先生が把握するわけだが、それを特殊と見るか、一般と見るか、文部科学省の施策には違いが出てくるのではないだろうか。
集計プランを作れないなら、生データを匿名化して公開するという方法もある。
もっとも匿名化にはそれなりの工夫が必要である。意図をもって集計しないと何をマスキングすれば良いかもわからないし、半端なマスキングでは個人を特定できてしまう。
たとえば、地域差があまりないデータにおいて、地域をマスキングするとかすれば、居住地から個人を推定することはできなくなるから、匿名化の方法として可能性があると思うけれどどうだろう。