c*****1 发帖数: 131 | 1 比方说数据如下:
x1 x2
d1 10 9
d2 11 9
d3 10 8
d4 15 11
d5 17 12
d6 9 9
d7 12 8
d8 22 11
d9 11 22
d10 22 9
其中x1,x2是频数(frequency),有什么statistics or test计算x1 and x2的分布有什
么不同?
谢谢 |
z**********i 发帖数: 12276 | 2 Wilcoxon-Mann-Whitney test?
proc npar1way data = wilcoxon;
class x;
var count;
run;
d x count
1 1 10
2 1 11
...
1 2 9
2 2 9
...
The results suggest that there is a statistically significant difference between the underlying distributions of the count of x1 and the count of x2 (z = ***, p = ***).
【在 c*****1 的大作中提到】 : 比方说数据如下: : x1 x2 : d1 10 9 : d2 11 9 : d3 10 8 : d4 15 11 : d5 17 12 : d6 9 9 : d7 12 8 : d8 22 11
|
j*******y 发帖数: 58 | 3 can this handle paired data?
【在 z**********i 的大作中提到】 : Wilcoxon-Mann-Whitney test? : proc npar1way data = wilcoxon; : class x; : var count; : run; : d x count : 1 1 10 : 2 1 11 : ... : 1 2 9
|
c*****1 发帖数: 131 | 4 主要是观察值是频数,比方说某个值出现的次数,不是简单的观测值,否则就直接pair
t test了。
我去查查你说的这个方法,看管不管用。包子送上,谢谢
【在 z**********i 的大作中提到】 : Wilcoxon-Mann-Whitney test? : proc npar1way data = wilcoxon; : class x; : var count; : run; : d x count : 1 1 10 : 2 1 11 : ... : 1 2 9
|
z**********i 发帖数: 12276 | 5 这个是NONPARAMETRIC, not assuming the normal distribution.
你的PAIRED DATA是NORMAL吗?是的话,用ttest就行。
【在 j*******y 的大作中提到】 : can this handle paired data?
|
z**********i 发帖数: 12276 | 6 收到包子,不错。
pair
【在 c*****1 的大作中提到】 : 主要是观察值是频数,比方说某个值出现的次数,不是简单的观测值,否则就直接pair : t test了。 : 我去查查你说的这个方法,看管不管用。包子送上,谢谢
|
k****i 发帖数: 347 | 7 这样应该是不对的
就算是wilcoxon test也要用wilcoxon signed rank test
还是应该具体解释一下x1, x2都是什么的frequency
d1和d2的x1有没有相关
同一天x1,x2有没有相关等等
【在 z**********i 的大作中提到】 : Wilcoxon-Mann-Whitney test? : proc npar1way data = wilcoxon; : class x; : var count; : run; : d x count : 1 1 10 : 2 1 11 : ... : 1 2 9
|
j*******y 发帖数: 58 | 8 我说的是paired,没说normal。我觉得应该test x1-x2 vs uniform distribution。
【在 z**********i 的大作中提到】 : 这个是NONPARAMETRIC, not assuming the normal distribution. : 你的PAIRED DATA是NORMAL吗?是的话,用ttest就行。
|
c*****1 发帖数: 131 | 9 打个比方,我的数据假定这样
100个sample,按身高由高到低排序,前10名d为1,10-20变量d为2,依次类推
x1和x2是两种不同的treatments,数据是给定treatment起反应的人数,
如d=4 x1=6表示30-40身高排名的10个人中给X1 treatment, 有6个人有反应
如d=5 x2=5表示40-50身高排名的10个人中给X2 treatment, 有5个人有反应
想比较X1和X2分布是否有差别。
稍微复杂了点,能否给些提示?多谢
俺觉得数据是频数,不是特定的measurements,Paired T 应该不对。
【在 k****i 的大作中提到】 : 这样应该是不对的 : 就算是wilcoxon test也要用wilcoxon signed rank test : 还是应该具体解释一下x1, x2都是什么的frequency : d1和d2的x1有没有相关 : 同一天x1,x2有没有相关等等
|
c*****1 发帖数: 131 | 10 能否说详细点?thx!
【在 j*******y 的大作中提到】 : 我说的是paired,没说normal。我觉得应该test x1-x2 vs uniform distribution。
|
|
|
j*******y 发帖数: 58 | 11 ft你这就用个wilcoxon test就行了。
【在 c*****1 的大作中提到】 : 打个比方,我的数据假定这样 : 100个sample,按身高由高到低排序,前10名d为1,10-20变量d为2,依次类推 : x1和x2是两种不同的treatments,数据是给定treatment起反应的人数, : 如d=4 x1=6表示30-40身高排名的10个人中给X1 treatment, 有6个人有反应 : 如d=5 x2=5表示40-50身高排名的10个人中给X2 treatment, 有5个人有反应 : 想比较X1和X2分布是否有差别。 : 稍微复杂了点,能否给些提示?多谢 : 俺觉得数据是频数,不是特定的measurements,Paired T 应该不对。
|
k****i 发帖数: 347 | 12 原来d是这个意思,我还以为是day...
这样的话,d1里的x1,x2应该当做repeated measures
6 out of 10个人有反应,应该按照binomial distribution的events/trials形式来分析
具体来说,应该在SAS里用proc genmod
data大概要做成这个样子
D TRT X N
1 0 n1 10
2 1 n2 10
...
SAS code大概是
proc genmod data=data;
class d;
model x/n= trt / dist=bin;
repeated subject=d / type=cs;
run;
如果想估计不同D的效果,就直接adjust for d
proc genmod data=data;
class d;
model x/n= d trt / dist=bin;
run;
【在 c*****1 的大作中提到】 : 打个比方,我的数据假定这样 : 100个sample,按身高由高到低排序,前10名d为1,10-20变量d为2,依次类推 : x1和x2是两种不同的treatments,数据是给定treatment起反应的人数, : 如d=4 x1=6表示30-40身高排名的10个人中给X1 treatment, 有6个人有反应 : 如d=5 x2=5表示40-50身高排名的10个人中给X2 treatment, 有5个人有反应 : 想比较X1和X2分布是否有差别。 : 稍微复杂了点,能否给些提示?多谢 : 俺觉得数据是频数,不是特定的measurements,Paired T 应该不对。
|
j*******y 发帖数: 58 | 13 why repeated?
分析
【在 k****i 的大作中提到】 : 原来d是这个意思,我还以为是day... : 这样的话,d1里的x1,x2应该当做repeated measures : 6 out of 10个人有反应,应该按照binomial distribution的events/trials形式来分析 : 具体来说,应该在SAS里用proc genmod : data大概要做成这个样子 : D TRT X N : 1 0 n1 10 : 2 1 n2 10 : ... : SAS code大概是
|
c*****1 发帖数: 131 | 14 不是repeated的
6是数出来的数
分析
【在 k****i 的大作中提到】 : 原来d是这个意思,我还以为是day... : 这样的话,d1里的x1,x2应该当做repeated measures : 6 out of 10个人有反应,应该按照binomial distribution的events/trials形式来分析 : 具体来说,应该在SAS里用proc genmod : data大概要做成这个样子 : D TRT X N : 1 0 n1 10 : 2 1 n2 10 : ... : SAS code大概是
|
C*******1 发帖数: 2134 | 15 1.t test to test mean
2.F test to test variance.
【在 c*****1 的大作中提到】 : 比方说数据如下: : x1 x2 : d1 10 9 : d2 11 9 : d3 10 8 : d4 15 11 : d5 17 12 : d6 9 9 : d7 12 8 : d8 22 11
|
c*****1 发帖数: 131 | 16 这个已经被否了。俺只是想,既然数据是counts,变量d可当做nominal的categorical变
量,有没有categorical data analysis的方法可以做,比方chi-square什么的,
【在 C*******1 的大作中提到】 : 1.t test to test mean : 2.F test to test variance.
|
C*******1 发帖数: 2134 | 17 我发现统计真的是扯淡,遇到这样的小样本问题,那些看起来
宏大,花里胡哨的各种理论全部死翘翘了。
【在 c*****1 的大作中提到】 : 这个已经被否了。俺只是想,既然数据是counts,变量d可当做nominal的categorical变 : 量,有没有categorical data analysis的方法可以做,比方chi-square什么的,
|
C*******1 发帖数: 2134 | 18 这样的小样本问题,只有加一些assumption,否则没什么意义。
信息太少了。
【在 c*****1 的大作中提到】 : 比方说数据如下: : x1 x2 : d1 10 9 : d2 11 9 : d3 10 8 : d4 15 11 : d5 17 12 : d6 9 9 : d7 12 8 : d8 22 11
|
C*******1 发帖数: 2134 | 19 试试bootstrap吧。
【在 c*****1 的大作中提到】 : 比方说数据如下: : x1 x2 : d1 10 9 : d2 11 9 : d3 10 8 : d4 15 11 : d5 17 12 : d6 9 9 : d7 12 8 : d8 22 11
|
j*******y 发帖数: 58 | 20 man, this is not a small sample problem. the data are frequeicies.
【在 C*******1 的大作中提到】 : 我发现统计真的是扯淡,遇到这样的小样本问题,那些看起来 : 宏大,花里胡哨的各种理论全部死翘翘了。
|
|
|
d*****t 发帖数: 7903 | 21 没明白。。。
【在 j*******y 的大作中提到】 : man, this is not a small sample problem. the data are frequeicies.
|
D******n 发帖数: 2836 | 22 chisq test.
【在 c*****1 的大作中提到】 : 比方说数据如下: : x1 x2 : d1 10 9 : d2 11 9 : d3 10 8 : d4 15 11 : d5 17 12 : d6 9 9 : d7 12 8 : d8 22 11
|
k****i 发帖数: 347 | 23 当然是repeated measure
30-40身高排名给了treatment X1,然后数出了6
同样一批人,给了treatment X2,然后数出个几
这样还不是repeated?
【在 c*****1 的大作中提到】 : 不是repeated的 : 6是数出来的数 : : 分析
|
D******n 发帖数: 2836 | 24 u probably didnt ask the right question.
It is not a distribution at all.
What do u mean the two distributions are different?
you should at least provide the total count for each d level.
【在 c*****1 的大作中提到】 : 打个比方,我的数据假定这样 : 100个sample,按身高由高到低排序,前10名d为1,10-20变量d为2,依次类推 : x1和x2是两种不同的treatments,数据是给定treatment起反应的人数, : 如d=4 x1=6表示30-40身高排名的10个人中给X1 treatment, 有6个人有反应 : 如d=5 x2=5表示40-50身高排名的10个人中给X2 treatment, 有5个人有反应 : 想比较X1和X2分布是否有差别。 : 稍微复杂了点,能否给些提示?多谢 : 俺觉得数据是频数,不是特定的measurements,Paired T 应该不对。
|
c*****1 发帖数: 131 | 25 给每个回答的同学发了个小包子,多谢
【在 c*****1 的大作中提到】 : 比方说数据如下: : x1 x2 : d1 10 9 : d2 11 9 : d3 10 8 : d4 15 11 : d5 17 12 : d6 9 9 : d7 12 8 : d8 22 11
|