由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Go版 - 阿法狗和柯洁等级分相差17分
相关主题
柯洁和李喆的反应都很正常柯洁只领先阿法狗3分了
好多人说柯洁是世界第一,可是看俩老外讲棋,对比国内讲棋,围棋东亚溃败早晚的事 (转载)
柯洁后半盘看来比较差阿法狗给职业棋手们上了一课
古力对李师师是真爱啊柯洁说不想和阿法狗下了
阿法狗只离柯洁12分之遥了柯洁:电脑无敌?先过我这关 我胜算大概六七成
看了眼棋渣的微博古狗不马上跃柯姐,估计以后也不会约了
李师师淬火重生后五连胜柯洁等棋手现在能认识到AI的水平不晚吧
据传——柯洁十月份大战Google的 AlphaGo试想一下中国棋手柯洁到底能不能战胜机器人
相关话题的讨论汇总
话题: 等级分话题: 棋手话题: 准确率话题: rating话题: 预测
进入Go版参与讨论
1 (共1页)
D*******r
发帖数: 2323
1
如果李世石下个星期的应氏杯半决赛胜朴廷桓两局,那么阿法狗将被送上等级分第一的
位置。
m**d
发帖数: 21441
2
为什么李世石赢,阿尔法狗排名上升?

【在 D*******r 的大作中提到】
: 如果李世石下个星期的应氏杯半决赛胜朴廷桓两局,那么阿法狗将被送上等级分第一的
: 位置。

D*******r
发帖数: 2323
3
因为一个棋手的等级分,是根据对手的等级分计算的。当然,这个计算会随着时间而衰
减,但是如果你近期战胜了某个棋手,而这个棋手又马上战胜了多名其他棋手,你的等
级分就会随着败在你手下的这位棋手后来的不断胜利而升高,不过,要是你胜了这位棋
手,而他几年后再胜其他棋手,他的等级分升高对你就几乎没影响了。

【在 m**d 的大作中提到】
: 为什么李世石赢,阿尔法狗排名上升?
M*******p
发帖数: 5626
4
石头不是刚输给古力吗? 难道狗的积分不跟着下降?
p****l
发帖数: 197
5
石头输给古力,狗首次降分,好像7分。
D*******r
发帖数: 2323
6
跟着下降了。32强的比赛降得比较少,如果是大赛的决赛半决赛对等级分影响比较大。

【在 M*******p 的大作中提到】
: 石头不是刚输给古力吗? 难道狗的积分不跟着下降?
l*w
发帖数: 567
7
感觉有点奇怪。
等级分的计算是不能回溯的吧?否则不乱套了。回溯的话,没法算清了。
还是阿法狗特事特办?

【在 D*******r 的大作中提到】
: 跟着下降了。32强的比赛降得比较少,如果是大赛的决赛半决赛对等级分影响比较大。
p****l
发帖数: 197
8
有时间权重。总之近期内对手的近期胜负都会影响。

【在 l*w 的大作中提到】
: 感觉有点奇怪。
: 等级分的计算是不能回溯的吧?否则不乱套了。回溯的话,没法算清了。
: 还是阿法狗特事特办?

D*******r
发帖数: 2323
9
上面已经解释过了,会随着时间而影响衰减。如果你这个月灭谋棋手五盘,而该棋手下
个月就灭了其它棋手N盘,那么你的等级分就会随着被你灭的棋手的等级分上升而有大
幅上升。如果你是五年前灭的该棋手,那么该棋手现在的等级分上升或者下降对你的等
级分都几乎无影响。

【在 l*w 的大作中提到】
: 感觉有点奇怪。
: 等级分的计算是不能回溯的吧?否则不乱套了。回溯的话,没法算清了。
: 还是阿法狗特事特办?

l*w
发帖数: 567
10
据我所知,目前中国棋院的等级分不是回溯的。业余乒乓球算积分也是不回溯的。绝大
多数等级分是不回溯的。
职业网球等级分的算法很特殊。不是根据比赛对手算,而是根据比赛总成绩算。有所谓
保分只说,就是要比较一年前自己的成绩,保不住就分数下跌。
围棋等级分的算法是,每一场比赛都会结算,影响因素是两人的当时的分数和胜负。这
个是国际上通用的公式。
不知你说的那个回溯算法是从哪里看来的。


: 上面已经解释过了,会随着时间而影响衰减。如果你这个月灭谋棋手五盘,而该
棋手下

: 个月就灭了其它棋手N盘,那么你的等级分就会随着被你灭的棋手的等级分上升
而有大

: 幅上升。如果你是五年前灭的该棋手,那么该棋手现在的等级分上升或者下降对
你的等

: 级分都几乎无影响。



【在 D*******r 的大作中提到】
: 上面已经解释过了,会随着时间而影响衰减。如果你这个月灭谋棋手五盘,而该棋手下
: 个月就灭了其它棋手N盘,那么你的等级分就会随着被你灭的棋手的等级分上升而有大
: 幅上升。如果你是五年前灭的该棋手,那么该棋手现在的等级分上升或者下降对你的等
: 级分都几乎无影响。

相关主题
看了眼棋渣的微博柯洁只领先阿法狗3分了
李师师淬火重生后五连胜看俩老外讲棋,对比国内讲棋,围棋东亚溃败早晚的事 (转载)
据传——柯洁十月份大战Google的 AlphaGo阿法狗给职业棋手们上了一课
进入Go版参与讨论
D*******r
发帖数: 2323
11
gratings网站注得很清楚,他们用的是WHR (Whole History Rating) algorithm.
http://www.remi-coulom.fr/WHR/
这个页面有WHR paper的链接,读读吧,它解释了一般static rating和decayed
history rating的弊端。

【在 l*w 的大作中提到】
: 据我所知,目前中国棋院的等级分不是回溯的。业余乒乓球算积分也是不回溯的。绝大
: 多数等级分是不回溯的。
: 职业网球等级分的算法很特殊。不是根据比赛对手算,而是根据比赛总成绩算。有所谓
: 保分只说,就是要比较一年前自己的成绩,保不住就分数下跌。
: 围棋等级分的算法是,每一场比赛都会结算,影响因素是两人的当时的分数和胜负。这
: 个是国际上通用的公式。
: 不知你说的那个回溯算法是从哪里看来的。
:
:
: 上面已经解释过了,会随着时间而影响衰减。如果你这个月灭谋棋手五盘,而该
: 棋手下

l*w
发帖数: 567
12
看来这是一个比较新的计分系统。认可并采用它的人不多。
现在占压倒多数的传统的计分系统还是ELO。包括体育界现行的绝大多数等级分系统。
维基上有解释。
https://zh.wikipedia.org/wiki/%E7%AD%89%E7%BA%A7%E5%88%86
那个是不回溯的。原理简单易懂。

【在 D*******r 的大作中提到】
: gratings网站注得很清楚,他们用的是WHR (Whole History Rating) algorithm.
: http://www.remi-coulom.fr/WHR/
: 这个页面有WHR paper的链接,读读吧,它解释了一般static rating和decayed
: history rating的弊端。

D*******r
发帖数: 2323
13
别的比赛不知道,但是就围棋比赛来讲,WHR的研究者以kgs上23万局的比赛记录来测试
,elo rating的预测准确率是55.121%,而WHR的预测准确率是55.793%。
从统计学上讲,如果algorithm A比algorithm B 的预测准确率高0.091%,就有95%的把
握说A比B预测得更准确。

【在 l*w 的大作中提到】
: 看来这是一个比较新的计分系统。认可并采用它的人不多。
: 现在占压倒多数的传统的计分系统还是ELO。包括体育界现行的绝大多数等级分系统。
: 维基上有解释。
: https://zh.wikipedia.org/wiki/%E7%AD%89%E7%BA%A7%E5%88%86
: 那个是不回溯的。原理简单易懂。

p******e
发帖数: 528
14
我有个关于这个准确率的问题。我猜测这个准确率应该是在某种cross validation的方
法下算出来的
对于一定的sample的平均。那么既然是对于sample的评价,就应该有一个distribution
。换句话说。
这个准确率是有error bar的。那么如果这个error bar的size远大于他们中心值的
difference,而且
这2种方法给出的error不是显著correlated,那么在这种情况下是否还能说一种方法的
预言一定好于
另一种方法呢?换言之,这时候这个个统计量的差值是否有统计的significance?

【在 D*******r 的大作中提到】
: 别的比赛不知道,但是就围棋比赛来讲,WHR的研究者以kgs上23万局的比赛记录来测试
: ,elo rating的预测准确率是55.121%,而WHR的预测准确率是55.793%。
: 从统计学上讲,如果algorithm A比algorithm B 的预测准确率高0.091%,就有95%的把
: 握说A比B预测得更准确。

D*******r
发帖数: 2323
15
这个predication准确率是说,某一算法预测它算出来等级分高的那方取胜,预测的正
确率占所有sample的比例。
因为sample都是同段位(级位)的分先对局,所以大部分对局棋手的等级分比较接近。
至于你说的“中心值difference",不知道是指等级分相差范围多少以内的sample的结
果,还是说低段和高段的sample,不同算法算出来的difference有区别。
如果只是为了评价两种算法的优劣,可以专门对所有两种算法算出的对弈棋手的等级分
高低刚好相反的所有对局来统计,看看哪种算法得到的等级分高的一方最终赢棋的比率。

distribution

【在 p******e 的大作中提到】
: 我有个关于这个准确率的问题。我猜测这个准确率应该是在某种cross validation的方
: 法下算出来的
: 对于一定的sample的平均。那么既然是对于sample的评价,就应该有一个distribution
: 。换句话说。
: 这个准确率是有error bar的。那么如果这个error bar的size远大于他们中心值的
: difference,而且
: 这2种方法给出的error不是显著correlated,那么在这种情况下是否还能说一种方法的
: 预言一定好于
: 另一种方法呢?换言之,这时候这个个统计量的差值是否有统计的significance?

p******e
发帖数: 528
16
我的意思是这样的。
比方在同一段位总共有1000名棋手,我先取250名棋手,让他们对局,然后同两种不同
的rating系统
去预言胜率,再计算这两种系统预测的差值。然后再取250名棋手,如此反复。最有我
得到的是一个
关于这两种rating方法的预测准确率的difference的sample。这个sample应该是具有一
个distribution。
但是这个这个difference的distribution有可能是zero consistent的。换言之,任何
一个rating系统所
得到注册率的值不是一个值,而是一个分布。我觉得你举的那个例子中一次就用了所有
的1000名棋手,
所以原则上只是的到了一个对于预测准确率的difference的平均值,而无法知道这个
mean的分布的
宽度。

率。

【在 D*******r 的大作中提到】
: 这个predication准确率是说,某一算法预测它算出来等级分高的那方取胜,预测的正
: 确率占所有sample的比例。
: 因为sample都是同段位(级位)的分先对局,所以大部分对局棋手的等级分比较接近。
: 至于你说的“中心值difference",不知道是指等级分相差范围多少以内的sample的结
: 果,还是说低段和高段的sample,不同算法算出来的difference有区别。
: 如果只是为了评价两种算法的优劣,可以专门对所有两种算法算出的对弈棋手的等级分
: 高低刚好相反的所有对局来统计,看看哪种算法得到的等级分高的一方最终赢棋的比率。
:
: distribution

1 (共1页)
进入Go版参与讨论
相关主题
试想一下中国棋手柯洁到底能不能战胜机器人阿法狗只离柯洁12分之遥了
LG 杯小组第三轮时越连笑出局看了眼棋渣的微博
棋渣在3:5落后秀芝后,终于意识到当网红没啥意思了李师师淬火重生后五连胜
柯洁要跟阿尔法狗下棋了?据传——柯洁十月份大战Google的 AlphaGo
柯洁和李喆的反应都很正常柯洁只领先阿法狗3分了
好多人说柯洁是世界第一,可是看俩老外讲棋,对比国内讲棋,围棋东亚溃败早晚的事 (转载)
柯洁后半盘看来比较差阿法狗给职业棋手们上了一课
古力对李师师是真爱啊柯洁说不想和阿法狗下了
相关话题的讨论汇总
话题: 等级分话题: 棋手话题: 准确率话题: rating话题: 预测