4.母集団と標本

疫学調査をはじめとする「調査」の目的とはなんでしょうか。調査ではデータを取りあつかいます。そしてデータを取る目的は、そのデータが出てきたもとの集団について推測するためという場合がおおい。統計学では、この目的を強調するために、推測をしたいモノの集まりを母集団、母集団の推測をするために母集団から取り出されるいくつかのモノを標本(サンプル)といいます。

標本から母集団について推測するためには、標本は母集団からランダムに取り出さないといけません。「地域疫学調査による「ひきこもり」の実態調査」(PDFファイル)の「研究要旨」のなかに「調査対象は岡山、鹿児島、長崎3県で20歳以上の一般住民から無作為抽出された1646人」という表現がありますが、これを「母集団、ランダム、標本」という用語をつかって言いかえると……、

  • 「岡山、鹿児島、長崎3県で20歳以上の一般住民から」=母集団から
  • 「無作為抽出された」=ランダムに取り出された
  • 「1646人」=標本

このようになります。つまり調査対象は「母集団からランダムに取り出された標本」だということです。このように標本が無作為抽出によって母集団から取り出されているので、「地域疫学調査による『ひきこもり』の実態調査」では標本から母集団について推測することが可能です。

わたしが気になっているのは、この「地域疫学調査による『ひきこもり』の実態調査」の結果からみちびきだされた「全国で41万世帯にひきこもりが存在する」という全国レベルの結論の妥当性でした。調査の報告書を読んで、この全国レベルの結論について注意すべき点が2点あるのではないかと感じています。これらの注意点について、標本から母集団について推測するプロセスを具体的に確認しながら説明していきます。

なお、この調査では「対象者本人のひきこもり経験」と「対象者の子どものひきこもり状態」のふたつが質問がありますが、標本から母集団を推測するための統計的方法は共通しているので、ここでは「対象者の子どものひきこもり状態」の調査結果だけ取りあげることにします。