ページ番号:25000
掲載日:2021年9月1日
ここから本文です。
標本調査を実施する際に、標本の大きさをどの程度にすればよいかについては、設定する条件等によって、複雑な計算が必要とされます。(そのため、個々のケースによって扱いが異なってきます。)
ここでは、意識調査「ある事柄について賛成の人が何%」といった設問を想定して、最も簡便なケースを紹介します。
まず、標本の大きさ、つまり調査対象の数をいくつにすればよいかを求める式は、
n:標本の大きさ
d:標本誤差
λ:信頼水準によって定まる値
p:当該比率(賛成者の比率)
q:1-p(反対者の比率)
で表します。
この上記の式のうち、λ(ラムダ)は、推計結果の信頼水準によって定まる値で、
λ=1のときは、信頼水準が68.3%
λ=2のときは、信頼水準が95.4%
λ=3のときは、信頼水準が99.7%
となります。
※通常のケースでは、λ=2の値、すなわち、信頼水準95.4%をとります。
pは、「ある事柄について賛成の人が何%」の「何%」であり、qは1からpを引いたものです。
※通常、p×qが最大になる値(0.5×0.5=0.25、つまりp、qともに50%のとき)をとります。
dの標本誤差は、例として3%を想定します。この場合の「標本誤差」は、絶対誤差で、誤差3%とは、回答結果が50%の場合50±3%、すなわち、47~53%の間に真の値がある確率が95.4%であるということです。
これらの数値を冒頭の式に入れてみると、
という結果が導き出され、調査結果の標本誤差を3%以内に収めようとすれば、1111個の調査対象を選ぶことが必要ということが分かります。
ただし、実際の調査では回収率を想定して、1111個より多めに調査対象数を決めます。例えば、回収率を7割程度と想定した場合は、1111を0.7で割って求めた1587という数が、調査対象数を決める際の目安になります。
(なお、未回収による誤差は非標本誤差なので、標本理論は成り立ちません。上記の1587という数は、未回収標本の分布が母集団のそれと同一であったと仮定した場合の目安であり、通常は、未回収標本の分布には大きな偏りが見られます。)
なお、母集団の大きさ(N)が標本の大きさ(n)よりあまり大きくない場合(母集団の大きさがおよそ1万以下の場合)は、冒頭の式で求めた標本の大きさ(n)に修正係数を掛けて求めた(n')が、この場合に必要な標本の大きさとなります。(n')を求めることで調査対象数を小さくすることができます。
※修正係数=N÷(N+n-1)
本来、冒頭の標本の大きさを決定する式に行き着くまでには、多少面倒な計算を行っているのですが、ここでは省略させていただきます。
参考までに、「補足 標本の大きさの決定式」のページで説明しますので、興味のある方はご覧になってください。
この補足ページをご覧いただくと、標本の大きさは、統計の精度、つまりは標本誤差の許容範囲をどこまでにするのかによって、決まるということがお分かりいただけると思います。
統計実務基礎知識・平成30年3月改訂(公益財団法人 統計情報研究開発センター 発行)
お問い合わせ
より良いウェブサイトにするためにみなさまのご意見をお聞かせください