母集団と標本
統計的なデータの持つ情報は,どのような場合においても,それが取り出された集団に関して解釈されなければならない。われわれが知識・情報を得たいと考えている対象の全体を 母集団 といい,母集団から抽出された一部分を 標本 と呼ぶ。
図 1.母集団と標本の関係 |
---|
全体調査が無意味であるとき,または不可能なときや,時間・費用が制限されているときには 標本調査 をすることにより母集団の姿を推定することになる。
標本は母集団のほんの一部分にすぎないから,標本から得られる情報にもとづいて,それが抽出された母集団全体についての性質・構造・法則性を推測しようとすると,常に不確実性がつきまとうことになる。この不確実性を制御することが統計学の主題の一つである。
標本抽出法
標本を通して母集団の姿を正確にとらえるためには,標本は母集団を代表している必要がある。そのために 無作為抽出法 により標本を選ぶ必要がある。単純無作為抽出法 というのはそのための一つの方法であり,くじ引きに類する方法で標本を抽出する。
標本誤差
標本調査は,母集団全体を調べるのでのはなく,その一部分だけを調べるのであるから,全部を調べる際には生じ得ない性質の誤差が介入してくる。標本調査におけるこの種の誤差を 標本誤差 または抽出誤差という。標本誤差には二つの種類がある。偏り と 変動 がこれである。
母平均 μ,母分散 σ2 の母集団から大きさ n の確率標本をとるとき,標本平均値 は毎回変わりうる。これが変動である。しかし,標本平均値の平均値は μ に,分散は σ2/n になることがわかっている。n を大きくすれば,標本平均値は母平均のまわりの狭い範囲に存在することがわかる。これに対して,不適切な方法で標本抽出を行った場合には母平均値と全く異なった標本平均値が得られることがある。そして,そのような場合には n を大きくしても母平均値に近づくのではなく,偏った値の近辺に集中するだけである。これが,偏りである。アンケート調査を行う対象者を無作為標本抽出法によって抽出した場合であっても,実際にアンケートに答えてくれた対象者のデータには偏りが存在する可能性がある。
図 2.変動と偏り |
---|
なお,統計調査には標本誤差の他に,個々の調査単位の観察が正確に行われないために生ずる誤りがある。これを 非標本誤差 という。非標本誤差は標本調査の場合にも悉皆調査の場合にもある。しかし,調査対象数の大きい悉皆調査の場合には非標本誤差は大きくなりがちである。また,標本誤差は統計学的に計算可能であるが,非標本誤差の大きさを評価することは不可能である。
母集団と標本と同じ種類の言葉
- 母集団と標本のページへのリンク