6.調査結果についての注意点(2)

さて「地域疫学調査による「ひきこもり」の実態調査」(PDFファイル)について、もうひとつの注意点も説明しておきます。

さきほど、標本における「ひきこもり状態の子がいる世帯の比率は0.0085(0.85%)」というデータから、母集団における「ひきこもり状態の子がいる世帯の比率は0.0085(0.85%)」であると推測しました。しかしながら、標本の世帯比率=0.0085というひとつの値だけで母集団における世帯比率のような値を推定する場合、母集団についての推定値が完全に正しいことを期待するのは無理があります。そのような推定は、母集団における真の世帯比率はこの推定値の近くの値である、このような意味で理解したほうが実際的です。そのような標本から母集団への推測方法を、統計学では区間推定とよびます。

区間推定では、標本から区間を計算して「母集団に関する真の値はこの区間のなかにある」というような推測をおこないます。この報告書でも区間推定がおこなわれています。たとえば、母集団における「ひきこもり状態の子がいる世帯」の割合についての区間推定の結果について、報告書ではつぎのように表記しています。

0.85%(95%信頼区間 0.41%〜1.29%)

まず最初の「0.85%」は、さきほど説明したように、標本における「ひきこもり状態の子がいる世帯率=0.85%」から推測した、母集団における「ひきこもり状態の子がいる世帯率」の推定値です*1

それでは「95%信頼区間 0.41%〜1.29%」はどういう意味でしょうか。これは、95%の確率で、母集団における「ひきこもり状態の子がいる世帯の割合」が0.41%〜1.29%という区間のなかに含まれる、という意味です。標本からわかった世帯率=0.85%という値だけで母集団に関する真の値を推測するのは無理がある。そこで区間推定をおこなったところ、母集団における世帯率が0.41%〜1.29%という区間に含まれる確率が95%だとわかった、ということです。また、この信頼区間(0.41%〜1.29%)のちょうど中間地点に推定値(0.85%)があることから、推定値の近くにある値として母集団における真の世帯率が推定されていることが確認できます*2

日本の総世帯数に0.85%をかけた「約41万世帯」という数字を紹介しましたが、この日本全国のひきこもり状態の子が存在する世帯の数についても報告書では区間推定をおこなっています。その推定結果として、

95%信頼区間は概ね20万〜63万となる

このように報告されています。

この区間推定の結果から注意しなければならないことは、

  • 全国でひきこもりの子がいる世帯数の推定には、かなり誤差が含まれている

という点だとおもいます。ひきこもりの子がいる世帯数は全国でおよそ20万〜63万世帯、このようにおよそ43万世帯の誤差がこの推定では考慮されているのです。

この疫学調査の調査結果としては、「全国で約41万世帯」あるいは「全国で約41万世帯以上」という数字がひとり歩きしてしまいがちですし、報告書も「約41万世帯」という数字を前面に出している印象をうけます。しかし、この区間推定の結果によれば、全国でひきこもりの子が存在する世帯は41万世帯よりも少数の20万世帯であってもおかしくないわけです(もちろん、41万世帯よりも多い63万世帯かもしれない)。さらに、もう一度くりかえすならば、この調査の母集団は日本の全成人ではないので、このような全国レベルの世帯のお話には厳密な意味での統計学的な根拠が欠けていることも注意しておかなければならないでしょう。

*1:このようなひとつの値だけによる推定は、区間推定に対して点推定とよばれています。

*2:区間推定の計算は、ちょっと複雑なので注にしておきます。標本比率:p、標本数:n のとき、真の母集団比率は95%の確率でp \pm 1.96\sqrt{p(1 - p)/n} の中にあります。今回の「ひきこもりの子が存在する世帯率」の場合、p=0.0085、n=1646なので、これらの値を代入すると 0.0085 \pm 1.96\sqrt{0.0085(1 - 0.0085)/1646}、これを計算すれば95%信頼区間が「0.0041〜0.0129」になることが確認できます。この計算式をみれば、信頼区間の真ん中が点推定値であることがわかります。