由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
TVChinese版 - 【好声音技术贴】媒体评审和导师打分偏差在于算法错误
相关主题
庾澄庆组第二轮怎么把金池弄下去了!!!王韵壹:迫于残星,我的辣评好声音永远无法更新
王韵壹的确不错我倒 金池老爸
看完了第12期我心目中的好声音四强
后好声音时代哈林组的金池好强大啊
媒体到底是干啥的这个交叉分组
王韵壹原来是小三金池的someone like you太棒了!
王韵壹评好声音第二季金池&哈林 对你爱不完
评好声音第一季---王韵壹多样化的选手太少,大部分很快就会腻味
相关话题的讨论汇总
话题: 打分话题: 媒体话题: 校正话题: 百分制话题: 导师
进入TVChinese版参与讨论
1 (共1页)
h*****u
发帖数: 5
1
好声音最大的争议,就是媒体评分和导师打分偏差太大,这个完全是打分算法的问题。
下面给出一个校正方法,能够很好的缩小差异,得到合理打分。

【原因】:导师是百分制的连续打分,媒体是0或1的二项分布打分。假设对选手A和B评
分,对媒体i来说,i认为A和B没有显著差异(51分和49分)和有显著差异(100分和0分
)都只能给出A的结果。所以99个媒体同时对A和B打分,必然存在这类假阳性打分。这
个一个典型的统计学多重检验的问题。统计学得不好,期待达人给出更严谨的校正方法。
【结论】:媒体打分存在假阳/阴性,需要进行校正。

【校正模型】:score.adj = score*0.5151 + 24.5
score是媒体对选手打分,score.adj是校正后打分。也就是媒体打分的权重应该是0.
5151,导师的权重是1。例如,金池vs王韵壹,金池48票校正得分49.2,王韵壹51票校
正50.8。加上导师打分,金池49.2+51=100.2,王韵壹50.8+49=99.8,金池胜。

【算法细节】模型来源于很笨的数据模拟。。
假设我们采用更合理的打分方法,就是媒体评分也采用百分制。例如,对选手A,99个
媒体中35个给A投票。改成百分制,媒体i投票给A,那么百分制应该是在51-100之间一
个随机数,反之在0-49之间的一个随机数。随机模拟出一组媒体对A的百分制得分,计
算期望得到一个合理得分。重复模拟10000次,得到合理打分的分布。下面给出R代码:
count2score <- function(A, simn=10000)
B <- 99-A
score <- c(rep("a", A), rep("b", B))
realscore <- c()
for(j in 1:simn){
a <- c()
for(i in 1:99){
if(score[i]=="a"){
a[i] <- sample(51:100, 1)
}else{
a[i] <- sample(0:49, 1)
}
}
realscore[j] <- mean(a)
}
return(realscore)
}
例如,媒体给选手A投35票。
score.adj <- count2score(35)
校正打分的分布如图1。校正打分也就是期望为42.53。

从1票到99票计算校正的百分制打分,然后拟合模型,如图2,得到校正模型。
p*********8
发帖数: 1039
2
R code? 激动哈

法。

【在 h*****u 的大作中提到】
: 好声音最大的争议,就是媒体评分和导师打分偏差太大,这个完全是打分算法的问题。
: 下面给出一个校正方法,能够很好的缩小差异,得到合理打分。
:
: 【原因】:导师是百分制的连续打分,媒体是0或1的二项分布打分。假设对选手A和B评
: 分,对媒体i来说,i认为A和B没有显著差异(51分和49分)和有显著差异(100分和0分
: )都只能给出A的结果。所以99个媒体同时对A和B打分,必然存在这类假阳性打分。这
: 个一个典型的统计学多重检验的问题。统计学得不好,期待达人给出更严谨的校正方法。
: 【结论】:媒体打分存在假阳/阴性,需要进行校正。
:
: 【校正模型】:score.adj = score*0.5151 + 24.5

s******3
发帖数: 7297
3
浙江卫视引用媒体的99票 说实话就是让你粉丝吵架 就是唯恐天下不乱的
你这么搞 浙江卫视搞P啊
h*****u
发帖数: 5
4
打分有很明显的问题,但是又想不明白怎么用数学解,就直接R code模拟了。。
n********t
发帖数: 1843
5
简单来说你觉得媒体打百分制比较科学。
然后弄个公式尽量用票数拟合出分数的平均数。
关键问题来了
为什么你觉得媒体的百分制比较科学?
a****o
发帖数: 6612
6
第一,媒体打分和导师打分,是为制造争议和偶然性;
第二,媒体打分体现的人气加权;媒体分低并不是直接体现选手水平低,本来就不是这
个目的,没有必要画蛇添足。

法。

【在 h*****u 的大作中提到】
: 好声音最大的争议,就是媒体评分和导师打分偏差太大,这个完全是打分算法的问题。
: 下面给出一个校正方法,能够很好的缩小差异,得到合理打分。
:
: 【原因】:导师是百分制的连续打分,媒体是0或1的二项分布打分。假设对选手A和B评
: 分,对媒体i来说,i认为A和B没有显著差异(51分和49分)和有显著差异(100分和0分
: )都只能给出A的结果。所以99个媒体同时对A和B打分,必然存在这类假阳性打分。这
: 个一个典型的统计学多重检验的问题。统计学得不好,期待达人给出更严谨的校正方法。
: 【结论】:媒体打分存在假阳/阴性,需要进行校正。
:
: 【校正模型】:score.adj = score*0.5151 + 24.5

h*****u
发帖数: 5
7
对,校正用的方法很简单。
我在开始解释了为什么统一用百分制更合理,能够减小媒体不确定时的随机性。
更严谨的办法是用统计学的多重检验校正,期待有人来分析一下。

【在 n********t 的大作中提到】
: 简单来说你觉得媒体打百分制比较科学。
: 然后弄个公式尽量用票数拟合出分数的平均数。
: 关键问题来了
: 为什么你觉得媒体的百分制比较科学?

h*****u
发帖数: 5
8
我的的出发点是让打分更合理,不过娱乐节目为了制造争议,这么定规则就太有才了。

【在 a****o 的大作中提到】
: 第一,媒体打分和导师打分,是为制造争议和偶然性;
: 第二,媒体打分体现的人气加权;媒体分低并不是直接体现选手水平低,本来就不是这
: 个目的,没有必要画蛇添足。
:
: 法。

x******h
发帖数: 13678
9
99个媒体评委,每个评委投A的概率是p, 投B的概率是q,决定pq的是选手的人气?
a****o
发帖数: 6612
10
有的媒体评委,预先就就想好了投某个选手。跟选手的水平和发挥没有关系。

【在 x******h 的大作中提到】
: 99个媒体评委,每个评委投A的概率是p, 投B的概率是q,决定pq的是选手的人气?
相关主题
王韵壹原来是小三王韵壹:迫于残星,我的辣评好声音永远无法更新
王韵壹评好声音第二季我倒 金池老爸
评好声音第一季---王韵壹我心目中的好声音四强
进入TVChinese版参与讨论
x******h
发帖数: 13678
11

所以是人气....我们说的是统计,不分析个体

【在 a****o 的大作中提到】
: 有的媒体评委,预先就就想好了投某个选手。跟选手的水平和发挥没有关系。
n********t
发帖数: 1843
12
这是学术想法了。
但现实里很多是winner take all的游戏。动物世界里狮王一个霸占几十个母的,打架
失败的一个都没有。
我没有仔细推敲过,但我直觉阿,在人们眼球的争夺里也是winner take all的游戏。
你说好声音的56强里,论实力前几名和最后几名,未必就能强出一倍。但是两群人吸引
到的注意力,可能差了10倍都不止。
媒体每人一票,反而比较容易把这种趋势表现出来。你觉得呢?

【在 h*****u 的大作中提到】
: 对,校正用的方法很简单。
: 我在开始解释了为什么统一用百分制更合理,能够减小媒体不确定时的随机性。
: 更严谨的办法是用统计学的多重检验校正,期待有人来分析一下。

h*****u
发帖数: 5
13
对,winner take all的规则更加刺激,娱乐节目用比较合适,能制造争议。

【在 n********t 的大作中提到】
: 这是学术想法了。
: 但现实里很多是winner take all的游戏。动物世界里狮王一个霸占几十个母的,打架
: 失败的一个都没有。
: 我没有仔细推敲过,但我直觉阿,在人们眼球的争夺里也是winner take all的游戏。
: 你说好声音的56强里,论实力前几名和最后几名,未必就能强出一倍。但是两群人吸引
: 到的注意力,可能差了10倍都不止。
: 媒体每人一票,反而比较容易把这种趋势表现出来。你觉得呢?

i***a
发帖数: 11826
14
赞楼主的认真精神。

法。

【在 h*****u 的大作中提到】
: 好声音最大的争议,就是媒体评分和导师打分偏差太大,这个完全是打分算法的问题。
: 下面给出一个校正方法,能够很好的缩小差异,得到合理打分。
:
: 【原因】:导师是百分制的连续打分,媒体是0或1的二项分布打分。假设对选手A和B评
: 分,对媒体i来说,i认为A和B没有显著差异(51分和49分)和有显著差异(100分和0分
: )都只能给出A的结果。所以99个媒体同时对A和B打分,必然存在这类假阳性打分。这
: 个一个典型的统计学多重检验的问题。统计学得不好,期待达人给出更严谨的校正方法。
: 【结论】:媒体打分存在假阳/阴性,需要进行校正。
:
: 【校正模型】:score.adj = score*0.5151 + 24.5

o**o
发帖数: 3964
15
这个太。。。难怪有人看不惯统计速成。

【在 h*****u 的大作中提到】
: 好声音最大的争议,就是媒体评分和导师打分偏差太大,这个完全是打分算法的问题。
: 下面给出一个校正方法,能够很好的缩小差异,得到合理打分。
:
: 【原因】:导师是百分制的连续打分,媒体是0或1的二项分布打分。假设对选手A和B评
: 分,对媒体i来说,i认为A和B没有显著差异(51分和49分)和有显著差异(100分和0分
: )都只能给出A的结果。所以99个媒体同时对A和B打分,必然存在这类假阳性打分。这
: 个一个典型的统计学多重检验的问题。统计学得不好,期待达人给出更严谨的校正方法。
: 【结论】:媒体打分存在假阳/阴性,需要进行校正。
:
: 【校正模型】:score.adj = score*0.5151 + 24.5

v******a
发帖数: 45075
16
那些导师比文科生还文科生,你这数学对他们太深奥了

法。

【在 h*****u 的大作中提到】
: 好声音最大的争议,就是媒体评分和导师打分偏差太大,这个完全是打分算法的问题。
: 下面给出一个校正方法,能够很好的缩小差异,得到合理打分。
:
: 【原因】:导师是百分制的连续打分,媒体是0或1的二项分布打分。假设对选手A和B评
: 分,对媒体i来说,i认为A和B没有显著差异(51分和49分)和有显著差异(100分和0分
: )都只能给出A的结果。所以99个媒体同时对A和B打分,必然存在这类假阳性打分。这
: 个一个典型的统计学多重检验的问题。统计学得不好,期待达人给出更严谨的校正方法。
: 【结论】:媒体打分存在假阳/阴性,需要进行校正。
:
: 【校正模型】:score.adj = score*0.5151 + 24.5

v******a
发帖数: 45075
17
这贴把你都炸上来了啊

【在 o**o 的大作中提到】
: 这个太。。。难怪有人看不惯统计速成。
1 (共1页)
进入TVChinese版参与讨论
相关主题
多样化的选手太少,大部分很快就会腻味媒体到底是干啥的
继续剧透(慎入):刘欢哈林组4选1结果王韵壹原来是小三
那个剧透王韵壹评好声音第二季
结果和之前的剧透不一样啊?评好声音第一季---王韵壹
庾澄庆组第二轮怎么把金池弄下去了!!!王韵壹:迫于残星,我的辣评好声音永远无法更新
王韵壹的确不错我倒 金池老爸
看完了第12期我心目中的好声音四强
后好声音时代哈林组的金池好强大啊
相关话题的讨论汇总
话题: 打分话题: 媒体话题: 校正话题: 百分制话题: 导师