请问一个ROC AUC 问题？ - Statistics版

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

Statistics版 - 请问一个ROC AUC 问题？

相关主题
● 请教一个R里的survivalROC问题！	● 请问这句话什么意思？
● 问个logistic model的面试问题	● 请教一个统计的问题：如何决定一个能区别两类数据的阈值
● 想问一个关于评价prediction performance的问题	● 关于基因作为predictive biomarker的统计问题请教
● How to test the difference between two C statistics （want the P	● logistics reg 怎么看varibale 的correlation
● 谁来解释解释c-statistic为什么等于AUC	● 事关毕业，务必指点! covariance structure
● How to express cut-off value	● [R] ROC curve怎么指定cutoffs?
● sensitivity and specificity	● R-square of logistic regression
● 建模型，最后一步发现classification table不均匀，和解？	● proc logistic: how to build 2 X 2 classification table

相关话题的讨论汇总
话题: auc话题: roc话题: 增加话题: model话题: 模型

进入Statistics版参与讨论

(共1页)

w*******e
发帖数: 666

我目前在做有没有一个marker对某病的判别有没有差别的小project。原来的model（包
含age BMI ，family history etc）做出来AUC 0.842.在原来的model里加了这个
marker之后，AUC 反而降低了编程0.838.我一直觉得加了一个变量后，AUC不管增加得
多少肯定是增加。请问有可能会减少吗？

Y******Y
发帖数: 8753

auc减少了有可能是因为你增加的那个biomarker对某些subjects有missing values,所以
你的new models实际用的数据小了，虽然多了一个covariate.
查查看是不是这样

【在 w*******e 的大作中提到】

: 我目前在做有没有一个marker对某病的判别有没有差别的小project。原来的model（包
: 含age BMI ，family history etc）做出来AUC 0.842.在原来的model里加了这个
: marker之后，AUC 反而降低了编程0.838.我一直觉得加了一个变量后，AUC不管增加得
: 多少肯定是增加。请问有可能会减少吗？

B****n
发帖数: 11290

應該不是一定增加
AUC是表示隨機選一個人正確判別他有沒有病的機率
比方說你用logistic regression來作分析機率大於0.5屬於某一group
試想如果你的model只和其中少數幾個因子有關你加了一堆在你的模型那肯定會影響
你模型裡參數估計的準確性進而會降低你判別的準確性只是說只多加一些很少數的因
子對估計影響通常很小因此你看到的0.842和0.838差不多也不足為奇反之如果某一
重要的因子不在Model裡那可能對判別率就會有很大的影響

【在 w*******e 的大作中提到】

A*******s
发帖数: 3942

ranking loss 不一定等于 likelihood/entropy loss
你加多一个变量，likelihood必然是增加的
但是AUC就不一定了。

【在 w*******e 的大作中提到】

A*******s
发帖数: 3942

AUC比较好的解释应该是这样的吧
随机选一对positive/negative的组合，
模型把positive排在negative前面的概率
你的解释应该是misclassification rate吧

【在 B****n 的大作中提到】

: 應該不是一定增加
: AUC是表示隨機選一個人正確判別他有沒有病的機率
: 比方說你用logistic regression來作分析機率大於0.5屬於某一group
: 試想如果你的model只和其中少數幾個因子有關你加了一堆在你的模型那肯定會影響
: 你模型裡參數估計的準確性進而會降低你判別的準確性只是說只多加一些很少數的因
: 子對估計影響通常很小因此你看到的0.842和0.838差不多也不足為奇反之如果某一
: 重要的因子不在Model裡那可能對判別率就會有很大的影響

n*****n
发帖数: 3123

精算娃好cute啊

【在 A*******s 的大作中提到】

: AUC比较好的解释应该是这样的吧
: 随机选一对positive/negative的组合，
: 模型把positive排在negative前面的概率
: 你的解释应该是misclassification rate吧

A*******s
发帖数: 3942

长得像我，所以得强收敛于帅啊

【在 n*****n 的大作中提到】

: 精算娃好cute啊

M*P
发帖数: 6456

这点差别没关系吧？

【在 w*******e 的大作中提到】

n*****n
发帖数: 3123

BSO啊

【在 A*******s 的大作中提到】

: 长得像我，所以得强收敛于帅啊

B****n
发帖数: 11290

如果這樣的話就不會追求AUC最大的診斷方式了

【在 A*******s 的大作中提到】

: AUC比较好的解释应该是这样的吧
: 随机选一对positive/negative的组合，
: 模型把positive排在negative前面的概率
: 你的解释应该是misclassification rate吧

相关主题
● How to express cut-off value	● 请问这句话什么意思？
● sensitivity and specificity	● 请教一个统计的问题：如何决定一个能区别两类数据的阈值
● 建模型，最后一步发现classification table不均匀，和解？	● 关于基因作为predictive biomarker的统计问题请教
进入Statistics版参与讨论

A*******s
发帖数: 3942

AUC衡量的就是模型的rank ordering的能力
AUC最大的模型，
不意味着会给出关于患病风险的最准确的posterior prob estimates
但是它一般会给出按照风险从高到低排列最准确的一个序列
用misclassification rate，
还是用AUC，
或者用sensitivity, specificity
都得看实际需要吧

【在 B****n 的大作中提到】

: 如果這樣的話就不會追求AUC最大的診斷方式了

d******e
发帖数: 7844

weighted error，就是weighted miclassification rate是最常用的。
和F-beta score一个作用。

【在 A*******s 的大作中提到】

: AUC衡量的就是模型的rank ordering的能力
: AUC最大的模型，
: 不意味着会给出关于患病风险的最准确的posterior prob estimates
: 但是它一般会给出按照风险从高到低排列最准确的一个序列
: 用misclassification rate，
: 还是用AUC，
: 或者用sensitivity, specificity
: 都得看实际需要吧

B****n
发帖数: 11290

仔細的重讀了一下你說的是才是對的謝謝

【在 A*******s 的大作中提到】

l*********s
发帖数: 5409

zan! :-)

【在 A*******s 的大作中提到】

: 长得像我，所以得强收敛于帅啊

w*******e
发帖数: 666

谢谢大家的讨论！

【在 w*******e 的大作中提到】

(共1页)

进入Statistics版参与讨论

相关主题
● proc logistic: how to build 2 X 2 classification table	● 谁来解释解释c-statistic为什么等于AUC
● 急需帮助，关于比较ROC的问题。	● How to express cut-off value
● roc curve in R	● sensitivity and specificity
● 报两个offer-updated-附面试心得 (转载)	● 建模型，最后一步发现classification table不均匀，和解？
● 请教一个R里的survivalROC问题！	● 请问这句话什么意思？
● 问个logistic model的面试问题	● 请教一个统计的问题：如何决定一个能区别两类数据的阈值
● 想问一个关于评价prediction performance的问题	● 关于基因作为predictive biomarker的统计问题请教
● How to test the difference between two C statistics （want the P	● logistics reg 怎么看varibale 的correlation

相关话题的讨论汇总
话题: auc话题: roc话题: 增加话题: model话题: 模型

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

boards

未名新帖统计// 7月16日

历史上的今天