yuu-ito/標本数の決め方について調べてみる.md

Last active December 19, 2017 13:37

Star () You must be signed in to star a gist
Fork () You must be signed in to fork a gist

Learn more about clone URLs
Clone this repository at <script src="https://gist.github.com/yuu-ito/9525185.js"></script>
Save yuu-ito/9525185 to your computer and use it in GitHub Desktop.

Download ZIP

Raw

標本数の決め方について調べてみる.md

標本数の決め方について調べてみる。

参考

標本調査
- http://ja.wikipedia.org/wiki/%E6%A8%99%E6%9C%AC%E8%AA%BF%E6%9F%BB
ランダムサンプリングで標本数は、どのくらいあればいいのでしょうか？
- http://q.hatena.ne.jp/1213766432
標本はいくつ集めたらよいか
- http://www.ceser.hyogo-u.ac.jp/naritas/spss/sample_size/sample_size.htm
サンプリングの方法
- http://www.rikkyo.ne.jp/~ssakata/class/academy/materials/06.htm
- 引用

 ただし，Ｎは母集団の大きさ
 　　　　ｎは標本の大きさ
 　　　　Ｐは母比率の予想値
 　　　　ｅは信頼度 95 ％での標本誤差の許容値

R で関数を書いてみる。

getSampleNum<-function(N=1200000,
                       P=0.1,
                       e=0.02){
  N/(1+(N-1)*e^2/(1.96^2*P*(1-P)))
}

getSampleNum(N=100)     # -->  89.7235
getSampleNum(N=1000)    # --> 463.8717
getSampleNum(N=10000)   # --> 795.6654
getSampleNum(N=100000)  # --> 856.9613
getSampleNum(N=1000000) # --> 863.6144

引用

標本の大きさの決定には，

　① 母集団の大きさはあまり関係がなく
　② 標本誤差の大きさが決定的な影響を与えており
　③ 標本誤差を半分にするには標本を約４倍にすべきことである。

標本の大きさに影響を与えるもう一つの要因は予想される母比率(母分散)の大きさである。
標本の大きさが等しければ予想母比率が 50 ％であるとき標本誤差は最も大きくなる。

数式だと、母比率ってのがサンプル数に大きく影響する。
- 母平均と母分散は今までの調査だったりで得られたデータを元に設定するとのこと。

あとで調べる。

cross validated あたりにも参考になりそうなものがあるかも。
- http://stats.stackexchange.com/questions/tagged/sampling

suin commented Apr 12, 2017

Ruby版の関数

def getSampleNum(n=1200000, p=0.1, e=0.02)
	n / (1 + (n-1) * e ** 2 / (1.96 ** 2 * p * (1 - p)))
end

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment