由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Programming版 - R 语言求解惑
相关主题
一道C++面试题怎样用maven compile dependency 的source成jre?
emacs里能不能从后往前的query-replace? (转载)Angular 2像Python 3一样流行不动的可能性多大?
这个python 3000问一个matlab画图的问题
请教一个perl的问题 (转载)default Specifier是什么?
现在python编程是用哪个版本啊?解释一下吧Re: C语言的前途
用多线程怎么比单线程还慢呢?引用的几个基本问题,有点糊涂
软件业里最著名的一句话C语言的变量都一定要放在stack上吗?
AngularJS 稳定不?GCC 居然允许变量长度的向量
相关话题的讨论汇总
话题: 变量话题: glm话题: deviance话题: br话题: stepwise
进入Programming版参与讨论
1 (共1页)
m******r
发帖数: 1033
1
说R语言之前,说说王yin同学, 这人还是很牛b的; 牛b的人总有一些与众不同的地方
,普通人无法理解。 我看我儿子,好像总爱和我反着来 让我哭笑不得 他还挺认真。
想想算了 由他去吧。
然后说R语言。先说这个glm, 按说向前,向后,逐步回归(forward/backward/stepwise
)应该是glm里面一个重要选项才对。 没有这个选项,跑出来的东西我看毫无意义,当
然,你可以说他算了一堆数出来, So ?
第二,你可以用stepAIC,接着往下算。 我觉得很awkward, 本来一步的东西分两步走
,最后结果你给我存哪呢?? 你让我怎么做automation呢?? 这种文档谁又看得懂呢
??
https://stat.ethz.ch/R-manual/R-devel/library/MASS/html/stepAIC.html
第三,老是写deviance, 我不记得统计书里说什么deviance, 都是说-2L. 当然我才疏
学浅,有懂得给说说,这个deviance是个啥意思?
v*******e
发帖数: 11604
2
程序员搞起统计来了。。。你问的都是统计问题,不是R的问题。
1)glm 它就是个迭代的算某一类特定model参数的程序/方法,当然要算到收敛为止。
没听说glm里面还有forward/backward/stepwise这类的东西。
2)AIC,BIC这类东西是用来选model的,不是用来算model参数的。model里面要包含哪
些变量,不包含哪些变量(比如没有多少影响的变量就别包含在内了),这是AIC,BIC
之类东西的用处。如果你用它来决定你的general linear model里面需要包含哪些变量
,当然要和glm()交替运用。你先选一些变量做成model,然后用glm()算出这个
model的参数和likelihood,再增/减变量,再用glm()算出参数和likelihood,然后你
就能用AIC决定要不要把这增/减的变量包含在内。
3)wikipedia有简短介绍。

stepwise

【在 m******r 的大作中提到】
: 说R语言之前,说说王yin同学, 这人还是很牛b的; 牛b的人总有一些与众不同的地方
: ,普通人无法理解。 我看我儿子,好像总爱和我反着来 让我哭笑不得 他还挺认真。
: 想想算了 由他去吧。
: 然后说R语言。先说这个glm, 按说向前,向后,逐步回归(forward/backward/stepwise
: )应该是glm里面一个重要选项才对。 没有这个选项,跑出来的东西我看毫无意义,当
: 然,你可以说他算了一堆数出来, So ?
: 第二,你可以用stepAIC,接着往下算。 我觉得很awkward, 本来一步的东西分两步走
: ,最后结果你给我存哪呢?? 你让我怎么做automation呢?? 这种文档谁又看得懂呢
: ??
: https://stat.ethz.ch/R-manual/R-devel/library/MASS/html/stepAIC.html

l*********s
发帖数: 5409
3
forward/backward/stepwise 是搜索模型的方法,都是基于贪婪原则,不能保证你找到
全局最优解。
m******r
发帖数: 1033
4
首先谢谢你的回答。
我是民间数据‘科学家’, 听不懂理论讲解,不过还好会看数字。 谁能说说说,如果
我想用R做一下的输出,有没有简单的办法。 stepAIC似乎不行,我试过了。
http://www.stat.pitt.edu/stoffer/stepwiseregression.pdf 这篇文章4各变量,讨论对销售的影响,向前向后逐步法都有了,随便什么方法,看一眼都明白了。
https://ncss-wpengine.netdna-ssl.com/wp-content/themes/ncss/pdf/Procedures/
NCSS/Stepwise_Regression.pdf 这篇文章,我只看得懂第六页,因为上面有数字,有
一张大表,先删除第五个变量,因为p=88%, 第二次回归删除变量3,还是因为p value,
剩下三个变量,p都在7%, 挺简单的吧。
请问如何用R 做出类似的东西? 如果可能的话,最好存在什么对象里,最好是张表,
看上去一目了然。

【在 v*******e 的大作中提到】
: 程序员搞起统计来了。。。你问的都是统计问题,不是R的问题。
: 1)glm 它就是个迭代的算某一类特定model参数的程序/方法,当然要算到收敛为止。
: 没听说glm里面还有forward/backward/stepwise这类的东西。
: 2)AIC,BIC这类东西是用来选model的,不是用来算model参数的。model里面要包含哪
: 些变量,不包含哪些变量(比如没有多少影响的变量就别包含在内了),这是AIC,BIC
: 之类东西的用处。如果你用它来决定你的general linear model里面需要包含哪些变量
: ,当然要和glm()交替运用。你先选一些变量做成model,然后用glm()算出这个
: model的参数和likelihood,再增/减变量,再用glm()算出参数和likelihood,然后你
: 就能用AIC决定要不要把这增/减的变量包含在内。
: 3)wikipedia有简短介绍。

v*******e
发帖数: 11604
5
你google这些:stepwise glm regression using r,第一个hit就很好,看人家怎么做
的,里面code例子清清楚楚。


: 首先谢谢你的回答。

: 我是民间数据‘科学家’, 听不懂理论讲解,不过还好会看数字。 谁能说说说
,如果

: 我想用R做一下的输出,有没有简单的办法。 stepAIC似乎不行,我试过了。

: http://www.stat.pitt.edu/stoffer/stepwiseregression.pdf 这篇文章4各变量,讨论对销售的影响,向前向后逐步法都有了,随便什么方法,看一眼都明白了。

: https://ncss-wpengine.netdna-ssl.com/wp-content/themes/ncss/pdf/
Procedures/

: NCSS/Stepwise_Regression.pdf 这篇文章,我只看得懂第六页,因为上面有数
字,有

: 一张大表,先删除第五个变量,因为p=88%, 第二次回归删除变量3,还是因为p
value,

: 剩下三个变量,p都在7%, 挺简单的吧。

: 请问如何用R 做出类似的东西? 如果可能的话,最好存在什么对象里,最好是
张表,

: 看上去一目了然。



【在 m******r 的大作中提到】
: 首先谢谢你的回答。
: 我是民间数据‘科学家’, 听不懂理论讲解,不过还好会看数字。 谁能说说说,如果
: 我想用R做一下的输出,有没有简单的办法。 stepAIC似乎不行,我试过了。
: http://www.stat.pitt.edu/stoffer/stepwiseregression.pdf 这篇文章4各变量,讨论对销售的影响,向前向后逐步法都有了,随便什么方法,看一眼都明白了。
: https://ncss-wpengine.netdna-ssl.com/wp-content/themes/ncss/pdf/Procedures/
: NCSS/Stepwise_Regression.pdf 这篇文章,我只看得懂第六页,因为上面有数字,有
: 一张大表,先删除第五个变量,因为p=88%, 第二次回归删除变量3,还是因为p value,
: 剩下三个变量,p都在7%, 挺简单的吧。
: 请问如何用R 做出类似的东西? 如果可能的话,最好存在什么对象里,最好是张表,
: 看上去一目了然。

m******r
发帖数: 1033
6
是这篇文章吗 ? http://www.utstat.toronto.edu/~brunner/oldclass/appliedf11/handouts/2101f11StepwiseLogisticR.pdf
它的输出是如下:
> # Here was the chosen model from earlier
> redmod1 = glm(low ~ lwt+racefac+smoke+ptl+ht,family=binomial)
>
> backwards = step(fullmod) # Backwards selection is the default
Start: AIC= 221.28
low ~ age + lwt + racefac + smoke + ptl + ht + ui + ftv
Df Deviance AIC
- ftv 1 201.43 219.43
- age 1 201.93 219.93
201.28 221.28
- ptl 1 203.83 221.83
- ui 1 204.03 222.03
- racefac 2 208.75 224.75
- lwt 1 206.80 224.80
- smoke 1 206.91 224.91
- ht 1 208.81 226.81
1.我想看系数,p_value, 能给解决么 ?
2.把结果输出到对象,能给解决么?
3.指定enter,exist criterier, 5%, 10%, 能给解决么?
5.我给出的两篇文章,都是通过p_value,来选变量的(选进,选出)。 他这个是根据
AIC, 我不能说他错。 但我就想随大流,用p_value,请问能给解决么?

【在 v*******e 的大作中提到】
: 你google这些:stepwise glm regression using r,第一个hit就很好,看人家怎么做
: 的,里面code例子清清楚楚。
:
:
: 首先谢谢你的回答。
:
: 我是民间数据‘科学家’, 听不懂理论讲解,不过还好会看数字。 谁能说说说
: ,如果
:
: 我想用R做一下的输出,有没有简单的办法。 stepAIC似乎不行,我试过了。
:
: http://www.stat.pitt.edu/stoffer/stepwiseregression.pdf 这篇文章4各变量,讨论对销售的影响,向前向后逐步法都有了,随便什么方法,看一眼都明白了。
:
: https://ncss-wpengine.netdna-ssl.com/wp-content/themes/ncss/pdf/
: Procedures/

v*******e
发帖数: 11604
7
summary(redmodel1)


: 是这篇文章吗 ? http://www.utstat.toronto.edu/~brunner/oldclass/appliedf11/handouts/2101f11StepwiseLogisticR.pdf

: 它的输出是如下:

:

【在 m******r 的大作中提到】
: 是这篇文章吗 ? http://www.utstat.toronto.edu/~brunner/oldclass/appliedf11/handouts/2101f11StepwiseLogisticR.pdf
: 它的输出是如下:
: > # Here was the chosen model from earlier
: > redmod1 = glm(low ~ lwt+racefac+smoke+ptl+ht,family=binomial)
: >
: > backwards = step(fullmod) # Backwards selection is the default
: Start: AIC= 221.28
: low ~ age + lwt + racefac + smoke + ptl + ht + ui + ftv
: Df Deviance AIC
: - ftv 1 201.43 219.43

1 (共1页)
进入Programming版参与讨论
相关主题
GCC 居然允许变量长度的向量现在python编程是用哪个版本啊?
请教一个c问题 (转载)用多线程怎么比单线程还慢呢?
[求教大虾]关于C++编译期变量和运行期变量的区别,总是有疑惑软件业里最著名的一句话
问个C++的问题AngularJS 稳定不?
一道C++面试题怎样用maven compile dependency 的source成jre?
emacs里能不能从后往前的query-replace? (转载)Angular 2像Python 3一样流行不动的可能性多大?
这个python 3000问一个matlab画图的问题
请教一个perl的问题 (转载)default Specifier是什么?
相关话题的讨论汇总
话题: 变量话题: glm话题: deviance话题: br话题: stepwise