h*****u 发帖数: 5 | 1 好声音最大的争议,就是媒体评分和导师打分偏差太大,这个完全是打分算法的问题。
下面给出一个校正方法,能够很好的缩小差异,得到合理打分。
【原因】:导师是百分制的连续打分,媒体是0或1的二项分布打分。假设对选手A和B评
分,对媒体i来说,i认为A和B没有显著差异(51分和49分)和有显著差异(100分和0分
)都只能给出A的结果。所以99个媒体同时对A和B打分,必然存在这类假阳性打分。这
个一个典型的统计学多重检验的问题。统计学得不好,期待达人给出更严谨的校正方法。
【结论】:媒体打分存在假阳/阴性,需要进行校正。
【校正模型】:score.adj = score*0.5151 + 24.5
score是媒体对选手打分,score.adj是校正后打分。也就是媒体打分的权重应该是0.
5151,导师的权重是1。例如,金池vs王韵壹,金池48票校正得分49.2,王韵壹51票校
正50.8。加上导师打分,金池49.2+51=100.2,王韵壹50.8+49=99.8,金池胜。
【算法细节】模型来源于很笨的数据模拟。。
假设我们采用更合理的打分方法,就是媒体评分也采用百分制。例如,对选手A,99个
媒体中35个给A投票。改成百分制,媒体i投票给A,那么百分制应该是在51-100之间一
个随机数,反之在0-49之间的一个随机数。随机模拟出一组媒体对A的百分制得分,计
算期望得到一个合理得分。重复模拟10000次,得到合理打分的分布。下面给出R代码:
count2score <- function(A, simn=10000)
B <- 99-A
score <- c(rep("a", A), rep("b", B))
realscore <- c()
for(j in 1:simn){
a <- c()
for(i in 1:99){
if(score[i]=="a"){
a[i] <- sample(51:100, 1)
}else{
a[i] <- sample(0:49, 1)
}
}
realscore[j] <- mean(a)
}
return(realscore)
}
例如,媒体给选手A投35票。
score.adj <- count2score(35)
校正打分的分布如图1。校正打分也就是期望为42.53。
从1票到99票计算校正的百分制打分,然后拟合模型,如图2,得到校正模型。 |
p*********8 发帖数: 1039 | 2 R code? 激动哈
法。
【在 h*****u 的大作中提到】 : 好声音最大的争议,就是媒体评分和导师打分偏差太大,这个完全是打分算法的问题。 : 下面给出一个校正方法,能够很好的缩小差异,得到合理打分。 : : 【原因】:导师是百分制的连续打分,媒体是0或1的二项分布打分。假设对选手A和B评 : 分,对媒体i来说,i认为A和B没有显著差异(51分和49分)和有显著差异(100分和0分 : )都只能给出A的结果。所以99个媒体同时对A和B打分,必然存在这类假阳性打分。这 : 个一个典型的统计学多重检验的问题。统计学得不好,期待达人给出更严谨的校正方法。 : 【结论】:媒体打分存在假阳/阴性,需要进行校正。 : : 【校正模型】:score.adj = score*0.5151 + 24.5
|
s******3 发帖数: 7297 | 3 浙江卫视引用媒体的99票 说实话就是让你粉丝吵架 就是唯恐天下不乱的
你这么搞 浙江卫视搞P啊 |
h*****u 发帖数: 5 | 4 打分有很明显的问题,但是又想不明白怎么用数学解,就直接R code模拟了。。 |
n********t 发帖数: 1843 | 5 简单来说你觉得媒体打百分制比较科学。
然后弄个公式尽量用票数拟合出分数的平均数。
关键问题来了
为什么你觉得媒体的百分制比较科学? |
a****o 发帖数: 6612 | 6 第一,媒体打分和导师打分,是为制造争议和偶然性;
第二,媒体打分体现的人气加权;媒体分低并不是直接体现选手水平低,本来就不是这
个目的,没有必要画蛇添足。
法。
【在 h*****u 的大作中提到】 : 好声音最大的争议,就是媒体评分和导师打分偏差太大,这个完全是打分算法的问题。 : 下面给出一个校正方法,能够很好的缩小差异,得到合理打分。 : : 【原因】:导师是百分制的连续打分,媒体是0或1的二项分布打分。假设对选手A和B评 : 分,对媒体i来说,i认为A和B没有显著差异(51分和49分)和有显著差异(100分和0分 : )都只能给出A的结果。所以99个媒体同时对A和B打分,必然存在这类假阳性打分。这 : 个一个典型的统计学多重检验的问题。统计学得不好,期待达人给出更严谨的校正方法。 : 【结论】:媒体打分存在假阳/阴性,需要进行校正。 : : 【校正模型】:score.adj = score*0.5151 + 24.5
|
h*****u 发帖数: 5 | 7 对,校正用的方法很简单。
我在开始解释了为什么统一用百分制更合理,能够减小媒体不确定时的随机性。
更严谨的办法是用统计学的多重检验校正,期待有人来分析一下。
【在 n********t 的大作中提到】 : 简单来说你觉得媒体打百分制比较科学。 : 然后弄个公式尽量用票数拟合出分数的平均数。 : 关键问题来了 : 为什么你觉得媒体的百分制比较科学?
|
h*****u 发帖数: 5 | 8 我的的出发点是让打分更合理,不过娱乐节目为了制造争议,这么定规则就太有才了。
【在 a****o 的大作中提到】 : 第一,媒体打分和导师打分,是为制造争议和偶然性; : 第二,媒体打分体现的人气加权;媒体分低并不是直接体现选手水平低,本来就不是这 : 个目的,没有必要画蛇添足。 : : 法。
|
x******h 发帖数: 13678 | 9 99个媒体评委,每个评委投A的概率是p, 投B的概率是q,决定pq的是选手的人气? |
a****o 发帖数: 6612 | 10 有的媒体评委,预先就就想好了投某个选手。跟选手的水平和发挥没有关系。
【在 x******h 的大作中提到】 : 99个媒体评委,每个评委投A的概率是p, 投B的概率是q,决定pq的是选手的人气?
|
|
|
x******h 发帖数: 13678 | 11
所以是人气....我们说的是统计,不分析个体
【在 a****o 的大作中提到】 : 有的媒体评委,预先就就想好了投某个选手。跟选手的水平和发挥没有关系。
|
n********t 发帖数: 1843 | 12 这是学术想法了。
但现实里很多是winner take all的游戏。动物世界里狮王一个霸占几十个母的,打架
失败的一个都没有。
我没有仔细推敲过,但我直觉阿,在人们眼球的争夺里也是winner take all的游戏。
你说好声音的56强里,论实力前几名和最后几名,未必就能强出一倍。但是两群人吸引
到的注意力,可能差了10倍都不止。
媒体每人一票,反而比较容易把这种趋势表现出来。你觉得呢?
【在 h*****u 的大作中提到】 : 对,校正用的方法很简单。 : 我在开始解释了为什么统一用百分制更合理,能够减小媒体不确定时的随机性。 : 更严谨的办法是用统计学的多重检验校正,期待有人来分析一下。
|
h*****u 发帖数: 5 | 13 对,winner take all的规则更加刺激,娱乐节目用比较合适,能制造争议。
【在 n********t 的大作中提到】 : 这是学术想法了。 : 但现实里很多是winner take all的游戏。动物世界里狮王一个霸占几十个母的,打架 : 失败的一个都没有。 : 我没有仔细推敲过,但我直觉阿,在人们眼球的争夺里也是winner take all的游戏。 : 你说好声音的56强里,论实力前几名和最后几名,未必就能强出一倍。但是两群人吸引 : 到的注意力,可能差了10倍都不止。 : 媒体每人一票,反而比较容易把这种趋势表现出来。你觉得呢?
|
i***a 发帖数: 11826 | 14 赞楼主的认真精神。
法。
【在 h*****u 的大作中提到】 : 好声音最大的争议,就是媒体评分和导师打分偏差太大,这个完全是打分算法的问题。 : 下面给出一个校正方法,能够很好的缩小差异,得到合理打分。 : : 【原因】:导师是百分制的连续打分,媒体是0或1的二项分布打分。假设对选手A和B评 : 分,对媒体i来说,i认为A和B没有显著差异(51分和49分)和有显著差异(100分和0分 : )都只能给出A的结果。所以99个媒体同时对A和B打分,必然存在这类假阳性打分。这 : 个一个典型的统计学多重检验的问题。统计学得不好,期待达人给出更严谨的校正方法。 : 【结论】:媒体打分存在假阳/阴性,需要进行校正。 : : 【校正模型】:score.adj = score*0.5151 + 24.5
|
o**o 发帖数: 3964 | 15 这个太。。。难怪有人看不惯统计速成。
【在 h*****u 的大作中提到】 : 好声音最大的争议,就是媒体评分和导师打分偏差太大,这个完全是打分算法的问题。 : 下面给出一个校正方法,能够很好的缩小差异,得到合理打分。 : : 【原因】:导师是百分制的连续打分,媒体是0或1的二项分布打分。假设对选手A和B评 : 分,对媒体i来说,i认为A和B没有显著差异(51分和49分)和有显著差异(100分和0分 : )都只能给出A的结果。所以99个媒体同时对A和B打分,必然存在这类假阳性打分。这 : 个一个典型的统计学多重检验的问题。统计学得不好,期待达人给出更严谨的校正方法。 : 【结论】:媒体打分存在假阳/阴性,需要进行校正。 : : 【校正模型】:score.adj = score*0.5151 + 24.5
|
v******a 发帖数: 45075 | 16 那些导师比文科生还文科生,你这数学对他们太深奥了
法。
【在 h*****u 的大作中提到】 : 好声音最大的争议,就是媒体评分和导师打分偏差太大,这个完全是打分算法的问题。 : 下面给出一个校正方法,能够很好的缩小差异,得到合理打分。 : : 【原因】:导师是百分制的连续打分,媒体是0或1的二项分布打分。假设对选手A和B评 : 分,对媒体i来说,i认为A和B没有显著差异(51分和49分)和有显著差异(100分和0分 : )都只能给出A的结果。所以99个媒体同时对A和B打分,必然存在这类假阳性打分。这 : 个一个典型的统计学多重检验的问题。统计学得不好,期待达人给出更严谨的校正方法。 : 【结论】:媒体打分存在假阳/阴性,需要进行校正。 : : 【校正模型】:score.adj = score*0.5151 + 24.5
|
v******a 发帖数: 45075 | 17 这贴把你都炸上来了啊
【在 o**o 的大作中提到】 : 这个太。。。难怪有人看不惯统计速成。
|