r*****u 发帖数: 51 | 1 统计的东西不太懂,看的糊里糊涂的,请大虾给讲讲,轻拍-_-|||
比如我想分析以下这些因素与生存时间的关系,
Surv(time, event)~ gender + age + drug dose + race + ....
我想找出其中与survival相关的因素及其hazard proportion,
1) 关于coxph
那些p>0.05的因素是不是可以直接剔除了?
2)cox.zph
是不是要先做coxph,把p<0.05的因素放在新的公式里做cox.zph。
好像说p<0.05的是不符合PH的,需要转换成interaction或分层,可是到底是应该选哪
个呢?
不知道是不是有点不知所云,谢谢~~ | w*********t 发帖数: 17 | 2 cox.zph is used to test the ph assumption, i.e., if the effect of a
covariate changes along with time. The theory behind this test is explained
here:
http://psfaculty.ucdavis.edu/bsjjones/coxslides2.pdf
If the pvalue from cox.zph is too small to assume the ph assumption holds,
you can use stratified cox ph model, see https://stat.ethz.ch/education/
semesters/ss2011/seminar/contents/presentation_5.pdf
To select the best model, use Likelihood ratio test.
But in reality the problem is more complex. For example, some variables may
be unrelated to the response variable or there may be multicollinearity
problem.
If your priority is prediction accuracy, try to figure out a way to use
cross validation. | z*******1 发帖数: 206 | 3
是否剔除covariates 取决于很多条件,but not P value。
1. 正如楼上所提及的LRT test 可用作model选择, 另外还有AIC, BIC等等;
2. 取决于domain knowledge,例如Age, gender 等variables 通常必须考虑进入
model, no matter what happened on LRT test, AIC, BIC。 简单来说,如果已知
variables对 survival有影响,就必须do adjustment。
【在 r*****u 的大作中提到】 : 统计的东西不太懂,看的糊里糊涂的,请大虾给讲讲,轻拍-_-||| : 比如我想分析以下这些因素与生存时间的关系, : Surv(time, event)~ gender + age + drug dose + race + .... : 我想找出其中与survival相关的因素及其hazard proportion, : 1) 关于coxph : 那些p>0.05的因素是不是可以直接剔除了? : 2)cox.zph : 是不是要先做coxph,把p<0.05的因素放在新的公式里做cox.zph。 : 好像说p<0.05的是不符合PH的,需要转换成interaction或分层,可是到底是应该选哪 : 个呢?
| r*****u 发帖数: 51 | 4 谢谢楼上两位的回复。
是不是说cox.zph,p<0.05的variable需要进行转换,不能直接用。至于具体是怎么转
换,比如是strata(gender),还是age*gender,这些要根据实际情况来定,没有可以
套用的普试的方法来帮忙决定?
2. 请问一下coxph里面的p>0.05的variables怎么处理?如果不是作为剔除标准,那他
们在那里干什么用呢?又不显著。怎么样可以剔除一些variables呢?如果有好几十个
variables。
另外,您给的那两个pdf实在看不懂,不好意思,看到那些公式就蒙了-_-|| |
|