h********3 发帖数: 2075 | 1 为什么使用中心极限定律Central Limit Theorem要求sample size sufficiently
large,都是要求>= 30。这个30,是怎么取得的?为什么不是20或者100? |
d******e 发帖数: 7844 | 2 这个真就是拍脑门想的。
【在 h********3 的大作中提到】 : 为什么使用中心极限定律Central Limit Theorem要求sample size sufficiently : large,都是要求>= 30。这个30,是怎么取得的?为什么不是20或者100?
|
h********3 发帖数: 2075 | 3 几乎所有的课本,slides都这样写。总有个道理可言吧。为什么是30?而不是31或者29
呢?
如果已经知道原来sample是从某个distribution model draw出来的,这样还可以算一
个confidence interval,然后从置信度(比如95%)来得到一个minimum sample size。
但是,中心极限定律针对任何distribution的,怎么就能得到30这个值呢?
【在 d******e 的大作中提到】 : 这个真就是拍脑门想的。
|
D**u 发帖数: 288 | 4 跟p<0.05一样应该是约定俗成了。
一个解释是,根据t-dist和normal的cdf之间的系统误差来决定的n, 很多real的small
data都被假设成了t-dist吧,所以用t算n还是说得通的,当然如果是一些非常态的
distribution,这个n就难讲了。t(1)跟normal就很像了,不过当n>30时,系统误差会大
概0.005 http://www.johndcook.com/normal_approx_to_t.html,对大多数人来说不会影响结果了.
check this one too, http://stats.stackexchange.com/questions/2541/is-there-a-reference-that-suggest-using-30-as-a-large-enough-sample-size |
b********r 发帖数: 764 | 5 木有道理。。。
很多时候sample size>30也不行,很多时候sample size>3000都不够 |
F*******2 发帖数: 371 | 6 Keep in mind that n is the sample size for each mean and not the number of
samples. Remember in a sampling distribution the number of samples is
assumed to be infinite. The sample size is the number of scores in each
sample; it is the number of scores that goes into the computation of each
mean.
http://onlinestatbook.com/stat_sim/sampling_dist/index.html
The simulation shows even if sample size=5, when you have enough number of
samples, sampling distribution of sample mean still follows normal
distribution. |
I*****a 发帖数: 5425 | 7 是定理
像上面的说的,没有绝对的数字
【在 h********3 的大作中提到】 : 为什么使用中心极限定律Central Limit Theorem要求sample size sufficiently : large,都是要求>= 30。这个30,是怎么取得的?为什么不是20或者100?
|
n*****3 发帖数: 1584 | 8 like pvalue .05, 当初牛人 拍拍 脑`带` 想的, 没`森莫 ....
【在 h********3 的大作中提到】 : 为什么使用中心极限定律Central Limit Theorem要求sample size sufficiently : large,都是要求>= 30。这个30,是怎么取得的?为什么不是20或者100?
|