- 標本調査
- ランダムサンプリングで標本数は、どのくらいあればいいのでしょうか?
- 標本はいくつ集めたらよいか
- サンプリングの方法
ただし,Nは母集団の大きさ nは標本の大きさ Pは母比率の予想値 eは信頼度 95 %での標本誤差の許容値
- R で関数を書いてみる。
getSampleNum<-function(N=1200000,
P=0.1,
e=0.02){
N/(1+(N-1)*e^2/(1.96^2*P*(1-P)))
}
getSampleNum(N=100) # --> 89.7235
getSampleNum(N=1000) # --> 463.8717
getSampleNum(N=10000) # --> 795.6654
getSampleNum(N=100000) # --> 856.9613
getSampleNum(N=1000000) # --> 863.6144
- 引用
標本の大きさの決定には, ① 母集団の大きさはあまり関係がなく ② 標本誤差の大きさが決定的な影響を与えており ③ 標本誤差を半分にするには標本を約4倍にすべきことである。 標本の大きさに影響を与えるもう一つの要因は予想される母比率(母分散)の大きさである。 標本の大きさが等しければ予想母比率が 50 %であるとき標本誤差は最も大きくなる。
- 数式だと、母比率ってのがサンプル数に大きく影響する。
- 母平均と母分散は今までの調査だったりで得られたデータを元に設定するとのこと。
- cross validated あたりにも参考になりそうなものがあるかも。
Ruby版の関数