由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Statistics版 - 急问:请教一个muliticollinearity的面试问题,谢谢!
相关主题
ROC curve可以用来比较变量吗请教多元线性回归的问题
regression的时候提高自由度对模式有什么好处?请问一个Regression的问题
Does multivariable logistic regression allow correlated independent variables?电话面试完了,肯定没戏,大家帮我看看题目,就算学习吧
model和variables都sig.但每个category都不siglogistic regression结果释疑,解读
any regression model with high prediction accuracy?求助Principal component analysis的power analysis
regression problem - go confused##面试过了,请教问题##
在线求助 eliminated highly correlated variables.PCA拟合问题
请问:R-square 可以用来评估GLM model得好坏吗急问大家一个问题,关于F test 和T test关系的
相关话题的讨论汇总
话题: 变量话题: regression话题: 模型话题: 面试
进入Statistics版参与讨论
1 (共1页)
s*********e
发帖数: 944
1
multiple linear regression,模型里有些变量的VIF很大,correlation between two
variables are high,证明severe muliticollinearity presents。
第1问,如果想remove其中一个变量,怎么知道remove哪个?
第2问,如果决定保留这两个变量,这两个变量的t-test都significant,那么该怎么解
释这两个beta-hat呢?
我对第1问的回答是,可以分别remove这2个变量,得到2个新的模型。比较两个模型,
比如prediction error via MSE, 看每个参数和整个模型是否make sense, 是否还有大
于10的VIF,R^2, AIC之类的, 从而决定选取哪个模型。
第2问,我能想到的就只是X1,X2 jointly influence response variable?
非常感谢!
z****g
发帖数: 1978
2
PCA,然后再还原
j*******2
发帖数: 309
3
for 第2问, I think you are right.colinearity makes it difficult to estimate
and interpret a particular regression coefficient because the data have
little information about the effect of changing one variable while holding
another variable constant. However, colinearity does not affect the joint
influence of highly correlated variables when tested simultaneously.
therefore, once groups of highly correlated predictors are identified, the
problem can be rectified by testing the contribution of an entire set with a
multiple d.f test rather than attempting to interpret the coefficient or
one d.f test for a single predictor.

two

【在 s*********e 的大作中提到】
: multiple linear regression,模型里有些变量的VIF很大,correlation between two
: variables are high,证明severe muliticollinearity presents。
: 第1问,如果想remove其中一个变量,怎么知道remove哪个?
: 第2问,如果决定保留这两个变量,这两个变量的t-test都significant,那么该怎么解
: 释这两个beta-hat呢?
: 我对第1问的回答是,可以分别remove这2个变量,得到2个新的模型。比较两个模型,
: 比如prediction error via MSE, 看每个参数和整个模型是否make sense, 是否还有大
: 于10的VIF,R^2, AIC之类的, 从而决定选取哪个模型。
: 第2问,我能想到的就只是X1,X2 jointly influence response variable?
: 非常感谢!

c*****1
发帖数: 131
4
第1问:keep the one which has larger wald chi-square value in regression
model. You answer also works if there are few candidate variables in the
model.
第2问:as somebody said-PCA

two

【在 s*********e 的大作中提到】
: multiple linear regression,模型里有些变量的VIF很大,correlation between two
: variables are high,证明severe muliticollinearity presents。
: 第1问,如果想remove其中一个变量,怎么知道remove哪个?
: 第2问,如果决定保留这两个变量,这两个变量的t-test都significant,那么该怎么解
: 释这两个beta-hat呢?
: 我对第1问的回答是,可以分别remove这2个变量,得到2个新的模型。比较两个模型,
: 比如prediction error via MSE, 看每个参数和整个模型是否make sense, 是否还有大
: 于10的VIF,R^2, AIC之类的, 从而决定选取哪个模型。
: 第2问,我能想到的就只是X1,X2 jointly influence response variable?
: 非常感谢!

s*********e
发帖数: 944
5

谢谢!长见识了。我原来还以为只有logistic regression有wald test呢~~~~
你的这个提议很make sense!
不过有一个问题就是,wald test是用var(beta-hat),但是对于linear regression来说,我们不知道true standard deviation,所以用t-test,这个问题怎么解决呢?
谢谢!

【在 c*****1 的大作中提到】
: 第1问:keep the one which has larger wald chi-square value in regression
: model. You answer also works if there are few candidate variables in the
: model.
: 第2问:as somebody said-PCA
:
: two

s*********e
发帖数: 944
6

谢谢!
能讲讲怎么个还原法吗?
我对PCA不了解?
也可以用Ridge regression吧?

【在 z****g 的大作中提到】
: PCA,然后再还原
1 (共1页)
进入Statistics版参与讨论
相关主题
急问大家一个问题,关于F test 和T test关系的any regression model with high prediction accuracy?
sample size vs. number of regressorsregression problem - go confused
急问高手,怎样在SAS实现logistic regression里independent variable重要性排序?在线求助 eliminated highly correlated variables.
请教一个相关性分析(correlation)的问题请问:R-square 可以用来评估GLM model得好坏吗
ROC curve可以用来比较变量吗请教多元线性回归的问题
regression的时候提高自由度对模式有什么好处?请问一个Regression的问题
Does multivariable logistic regression allow correlated independent variables?电话面试完了,肯定没戏,大家帮我看看题目,就算学习吧
model和variables都sig.但每个category都不siglogistic regression结果释疑,解读
相关话题的讨论汇总
话题: 变量话题: regression话题: 模型话题: 面试