由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
DataSciences版 - 请教一个用R做cox regression的问题
相关主题
请问这样的数据应该用什么样的模型适合。Random forests on imbalanced data
一道药厂computational biology的面试题National Big Data Events
PCA 可以用在mixture of continuous 和categorical variables (转载)基于DS的startup究竟都申请些什么专利?
求教linear regression的一道面试题Strata+Hadoop NYC 2014 开会归来,总结+job information
问个R的问题有人去Strata San Jose 2015 么?
Project :advertersiment click prediction问一个统计算average from ranges (转载)
有人参加明天在SANTA CLARA的strata问个time series forecasting的问题 (转载)
本周去了 O'Reilly的 Strata Data Conference有人参加这星期在new york的strata hadoop conference 吗?
相关话题的讨论汇总
话题: cox话题: ph话题: regression话题: coxph话题: variables
进入DataSciences版参与讨论
1 (共1页)
r*****u
发帖数: 51
1
统计的东西不太懂,看的糊里糊涂的,请大虾给讲讲,轻拍-_-|||
比如我想分析以下这些因素与生存时间的关系,
Surv(time, event)~ gender + age + drug dose + race + ....
我想找出其中与survival相关的因素及其hazard proportion,
1) 关于coxph
那些p>0.05的因素是不是可以直接剔除了?
2)cox.zph
是不是要先做coxph,把p<0.05的因素放在新的公式里做cox.zph。
好像说p<0.05的是不符合PH的,需要转换成interaction或分层,可是到底是应该选哪
个呢?
不知道是不是有点不知所云,谢谢~~
w*********t
发帖数: 17
2
cox.zph is used to test the ph assumption, i.e., if the effect of a
covariate changes along with time. The theory behind this test is explained
here:
http://psfaculty.ucdavis.edu/bsjjones/coxslides2.pdf
If the pvalue from cox.zph is too small to assume the ph assumption holds,
you can use stratified cox ph model, see https://stat.ethz.ch/education/
semesters/ss2011/seminar/contents/presentation_5.pdf
To select the best model, use Likelihood ratio test.
But in reality the problem is more complex. For example, some variables may
be unrelated to the response variable or there may be multicollinearity
problem.
If your priority is prediction accuracy, try to figure out a way to use
cross validation.
z*******1
发帖数: 206
3

是否剔除covariates 取决于很多条件,but not P value。
1. 正如楼上所提及的LRT test 可用作model选择, 另外还有AIC, BIC等等;
2. 取决于domain knowledge,例如Age, gender 等variables 通常必须考虑进入
model, no matter what happened on LRT test, AIC, BIC。 简单来说,如果已知
variables对 survival有影响,就必须do adjustment。

【在 r*****u 的大作中提到】
: 统计的东西不太懂,看的糊里糊涂的,请大虾给讲讲,轻拍-_-|||
: 比如我想分析以下这些因素与生存时间的关系,
: Surv(time, event)~ gender + age + drug dose + race + ....
: 我想找出其中与survival相关的因素及其hazard proportion,
: 1) 关于coxph
: 那些p>0.05的因素是不是可以直接剔除了?
: 2)cox.zph
: 是不是要先做coxph,把p<0.05的因素放在新的公式里做cox.zph。
: 好像说p<0.05的是不符合PH的,需要转换成interaction或分层,可是到底是应该选哪
: 个呢?

r*****u
发帖数: 51
4
谢谢楼上两位的回复。
是不是说cox.zph,p<0.05的variable需要进行转换,不能直接用。至于具体是怎么转
换,比如是strata(gender),还是age*gender,这些要根据实际情况来定,没有可以
套用的普试的方法来帮忙决定?
2. 请问一下coxph里面的p>0.05的variables怎么处理?如果不是作为剔除标准,那他
们在那里干什么用呢?又不显著。怎么样可以剔除一些variables呢?如果有好几十个
variables。
另外,您给的那两个pdf实在看不懂,不好意思,看到那些公式就蒙了-_-||
1 (共1页)
进入DataSciences版参与讨论
相关主题
有人参加这星期在new york的strata hadoop conference 吗?问个R的问题
San Jose Strata Conference Meet up (转载)Project :advertersiment click prediction
[Data Science Project Case]Future Income predicting有人参加明天在SANTA CLARA的strata
Twitter Data Scientist 电面题目本周去了 O'Reilly的 Strata Data Conference
请问这样的数据应该用什么样的模型适合。Random forests on imbalanced data
一道药厂computational biology的面试题National Big Data Events
PCA 可以用在mixture of continuous 和categorical variables (转载)基于DS的startup究竟都申请些什么专利?
求教linear regression的一道面试题Strata+Hadoop NYC 2014 开会归来,总结+job information
相关话题的讨论汇总
话题: cox话题: ph话题: regression话题: coxph话题: variables