由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Statistics版 - Residual and Partial Correlation
相关主题
SAS question - baozi两分法随机模拟试验SAS Code (Part I)
Unexpected statistical analysis results in Cox regression2 sample t-test with bootstrap 怎么搞?
matlab里怎么做residual是自回归的regression? (转载)two-way anova 的F-value 的意义。
问一个Model的问题regression后的residual是个双峰分布
怎样用R 来提取 micrarray 中的regressor variable 的值? (转载)residual~predict plot出现这个样子,说明了什么?
normality test mix modelR lm一问
问一个用simulation的问题A question about regression
deviance residualQuestion Proc GENMOD
相关话题的讨论汇总
话题: var2话题: var1话题: outcome话题: residual
进入Statistics版参与讨论
1 (共1页)
a***r
发帖数: 420
1
做助教,本来只是想做个教学demo,show一下confounding 和 partial correlation的
概念,结果纠结了。。。
我simulate了三个variable: outcome, var1, var2。其中outcome是binary; var1 有
三个category 1/2/3; var2 continuous。三者之间都有correlation,我的目的是show
var2对var1和outcome之间association的confounding
R code如下:
> table(outcome)
outcome
0 1
52 48
> table(var1)
var1
0 1 2
19 44 37
> summary(var2)
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.002583 0.053960 0.105000 0.122800 0.184200 0.392700
> cor(outcome,var1)
[1] 0.2854862
> cor(outcome,var2)
[1] 0.1518360
> cor(var1,var2)
[1] 0.1851194
##然后把outcome,var1因为var2造成的variation 分别 partial out:
beta1 <- solve(t(var2) %*% var2) %*% t(var2) %*% outcome
resid_out <- outcome - beta1*var2
beta2 <- solve(t(var2) %*% var2) %*% t(var2) %*% var1
resid_var1 <- var1 - beta2*var2
##然后算partial correlation:
> cor(resid_out,resid_var1)
[1] 0.3924849
##结果比原来的correlation大!!!!!!!
##可是可是,如果直接用lm:
> residual_out <- as.numeric(residuals(lm(outcome ~ var2)))
> residual_var1 <-as.numeric(residuals(lm(var1 ~ var2)))
> cor(residual_out,residual_var1)
[1] 0.2649774
##结果似乎又make sense了。。。
所以看起来是我求residual的方法有问题,我是算了个beta estimation,然后把原值
减去predicted。 我一直以为lm用的LSE,算出来也是一样的。结果今天被颠覆了。。。
是因为outcome是binary不满足linear regression的assumption么,那lm的residual又
是怎么求出来的呢?
诚求大侠指点,是哪里出了问题??
包子谢!bow~~~
N******n
发帖数: 3003
2

show
你也可以simulate outcome=beta1*var1+beta2*var2, beta1 and beta2 can be
assumed as their corresponding partial correlation

【在 a***r 的大作中提到】
: 做助教,本来只是想做个教学demo,show一下confounding 和 partial correlation的
: 概念,结果纠结了。。。
: 我simulate了三个variable: outcome, var1, var2。其中outcome是binary; var1 有
: 三个category 1/2/3; var2 continuous。三者之间都有correlation,我的目的是show
: var2对var1和outcome之间association的confounding
: R code如下:
: > table(outcome)
: outcome
: 0 1
: 52 48

a***r
发帖数: 420
3
谢谢,你是说当它们的variance都是1的时候吧
不过我的问题是为啥直接算residual不对,lm算出来却好像是对的

【在 N******n 的大作中提到】
:
: show
: 你也可以simulate outcome=beta1*var1+beta2*var2, beta1 and beta2 can be
: assumed as their corresponding partial correlation

1 (共1页)
进入Statistics版参与讨论
相关主题
Question Proc GENMOD怎样用R 来提取 micrarray 中的regressor variable 的值? (转载)
问个SAS regression问题normality test mix model
为什么数据‘看起来’不错,可是R^2却很低问一个用simulation的问题
这种方法在regression有效吗deviance residual
SAS question - baozi两分法随机模拟试验SAS Code (Part I)
Unexpected statistical analysis results in Cox regression2 sample t-test with bootstrap 怎么搞?
matlab里怎么做residual是自回归的regression? (转载)two-way anova 的F-value 的意义。
问一个Model的问题regression后的residual是个双峰分布
相关话题的讨论汇总
话题: var2话题: var1话题: outcome话题: residual