阿法狗和柯洁等级分相差17分 - Go版

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

Go版 - 阿法狗和柯洁等级分相差17分

相关主题
● 柯洁和李喆的反应都很正常	● 柯洁只领先阿法狗3分了
● 好多人说柯洁是世界第一，可是	● 看俩老外讲棋，对比国内讲棋，围棋东亚溃败早晚的事 (转载)
● 柯洁后半盘看来比较差	● 阿法狗给职业棋手们上了一课
● 古力对李师师是真爱啊	● 柯洁说不想和阿法狗下了
● 阿法狗只离柯洁12分之遥了	● 柯洁:电脑无敌?先过我这关我胜算大概六七成
● 看了眼棋渣的微博	● 古狗不马上跃柯姐，估计以后也不会约了
● 李师师淬火重生后五连胜	● 柯洁等棋手现在能认识到AI的水平不晚吧
● 据传——柯洁十月份大战Google的 AlphaGo	● 试想一下中国棋手柯洁到底能不能战胜机器人

相关话题的讨论汇总
话题: 等级分话题: 棋手话题: 准确率话题: rating话题: 预测

进入Go版参与讨论

(共1页)

D*******r
发帖数: 2323

如果李世石下个星期的应氏杯半决赛胜朴廷桓两局，那么阿法狗将被送上等级分第一的
位置。

m**d
发帖数: 21441

为什么李世石赢，阿尔法狗排名上升？

【在 D*******r 的大作中提到】

: 如果李世石下个星期的应氏杯半决赛胜朴廷桓两局，那么阿法狗将被送上等级分第一的
: 位置。

D*******r
发帖数: 2323

因为一个棋手的等级分，是根据对手的等级分计算的。当然，这个计算会随着时间而衰
减，但是如果你近期战胜了某个棋手，而这个棋手又马上战胜了多名其他棋手，你的等
级分就会随着败在你手下的这位棋手后来的不断胜利而升高，不过，要是你胜了这位棋
手，而他几年后再胜其他棋手，他的等级分升高对你就几乎没影响了。

【在 m**d 的大作中提到】

: 为什么李世石赢，阿尔法狗排名上升？

M*******p
发帖数: 5626

石头不是刚输给古力吗？难道狗的积分不跟着下降？

p****l
发帖数: 197

石头输给古力，狗首次降分，好像7分。

D*******r
发帖数: 2323

跟着下降了。32强的比赛降得比较少，如果是大赛的决赛半决赛对等级分影响比较大。

【在 M*******p 的大作中提到】

: 石头不是刚输给古力吗？难道狗的积分不跟着下降？

l*w
发帖数: 567

感觉有点奇怪。
等级分的计算是不能回溯的吧？否则不乱套了。回溯的话，没法算清了。
还是阿法狗特事特办？

【在 D*******r 的大作中提到】

: 跟着下降了。32强的比赛降得比较少，如果是大赛的决赛半决赛对等级分影响比较大。

p****l
发帖数: 197

有时间权重。总之近期内对手的近期胜负都会影响。

【在 l*w 的大作中提到】

: 感觉有点奇怪。
: 等级分的计算是不能回溯的吧？否则不乱套了。回溯的话，没法算清了。
: 还是阿法狗特事特办？

D*******r
发帖数: 2323

上面已经解释过了，会随着时间而影响衰减。如果你这个月灭谋棋手五盘，而该棋手下
个月就灭了其它棋手N盘，那么你的等级分就会随着被你灭的棋手的等级分上升而有大
幅上升。如果你是五年前灭的该棋手，那么该棋手现在的等级分上升或者下降对你的等
级分都几乎无影响。

【在 l*w 的大作中提到】

: 感觉有点奇怪。
: 等级分的计算是不能回溯的吧？否则不乱套了。回溯的话，没法算清了。
: 还是阿法狗特事特办？

l*w
发帖数: 567

据我所知，目前中国棋院的等级分不是回溯的。业余乒乓球算积分也是不回溯的。绝大
多数等级分是不回溯的。
职业网球等级分的算法很特殊。不是根据比赛对手算，而是根据比赛总成绩算。有所谓
保分只说，就是要比较一年前自己的成绩，保不住就分数下跌。
围棋等级分的算法是，每一场比赛都会结算，影响因素是两人的当时的分数和胜负。这
个是国际上通用的公式。
不知你说的那个回溯算法是从哪里看来的。

: 上面已经解释过了，会随着时间而影响衰减。如果你这个月灭谋棋手五盘，而该
棋手下

: 个月就灭了其它棋手N盘，那么你的等级分就会随着被你灭的棋手的等级分上升
而有大

: 幅上升。如果你是五年前灭的该棋手，那么该棋手现在的等级分上升或者下降对
你的等

: 级分都几乎无影响。

【在 D*******r 的大作中提到】

: 上面已经解释过了，会随着时间而影响衰减。如果你这个月灭谋棋手五盘，而该棋手下
: 个月就灭了其它棋手N盘，那么你的等级分就会随着被你灭的棋手的等级分上升而有大
: 幅上升。如果你是五年前灭的该棋手，那么该棋手现在的等级分上升或者下降对你的等
: 级分都几乎无影响。

相关主题
● 看了眼棋渣的微博	● 柯洁只领先阿法狗3分了
● 李师师淬火重生后五连胜	● 看俩老外讲棋，对比国内讲棋，围棋东亚溃败早晚的事 (转载)
● 据传——柯洁十月份大战Google的 AlphaGo	● 阿法狗给职业棋手们上了一课
进入Go版参与讨论

D*******r
发帖数: 2323

gratings网站注得很清楚，他们用的是WHR (Whole History Rating) algorithm.
http://www.remi-coulom.fr/WHR/
这个页面有WHR paper的链接，读读吧，它解释了一般static rating和decayed
history rating的弊端。

【在 l*w 的大作中提到】

: 据我所知，目前中国棋院的等级分不是回溯的。业余乒乓球算积分也是不回溯的。绝大
: 多数等级分是不回溯的。
: 职业网球等级分的算法很特殊。不是根据比赛对手算，而是根据比赛总成绩算。有所谓
: 保分只说，就是要比较一年前自己的成绩，保不住就分数下跌。
: 围棋等级分的算法是，每一场比赛都会结算，影响因素是两人的当时的分数和胜负。这
: 个是国际上通用的公式。
: 不知你说的那个回溯算法是从哪里看来的。
:
:
: 上面已经解释过了，会随着时间而影响衰减。如果你这个月灭谋棋手五盘，而该
: 棋手下

l*w
发帖数: 567

看来这是一个比较新的计分系统。认可并采用它的人不多。
现在占压倒多数的传统的计分系统还是ELO。包括体育界现行的绝大多数等级分系统。
维基上有解释。
https://zh.wikipedia.org/wiki/%E7%AD%89%E7%BA%A7%E5%88%86
那个是不回溯的。原理简单易懂。

【在 D*******r 的大作中提到】

: gratings网站注得很清楚，他们用的是WHR (Whole History Rating) algorithm.
: http://www.remi-coulom.fr/WHR/
: 这个页面有WHR paper的链接，读读吧，它解释了一般static rating和decayed
: history rating的弊端。

D*******r
发帖数: 2323

别的比赛不知道，但是就围棋比赛来讲，WHR的研究者以kgs上23万局的比赛记录来测试
，elo rating的预测准确率是55.121%，而WHR的预测准确率是55.793%。
从统计学上讲，如果algorithm A比algorithm B 的预测准确率高0.091%，就有95%的把
握说A比B预测得更准确。

【在 l*w 的大作中提到】

: 看来这是一个比较新的计分系统。认可并采用它的人不多。
: 现在占压倒多数的传统的计分系统还是ELO。包括体育界现行的绝大多数等级分系统。
: 维基上有解释。
: https://zh.wikipedia.org/wiki/%E7%AD%89%E7%BA%A7%E5%88%86
: 那个是不回溯的。原理简单易懂。

p******e
发帖数: 528

我有个关于这个准确率的问题。我猜测这个准确率应该是在某种cross validation的方
法下算出来的
对于一定的sample的平均。那么既然是对于sample的评价，就应该有一个distribution
。换句话说。
这个准确率是有error bar的。那么如果这个error bar的size远大于他们中心值的
difference，而且
这2种方法给出的error不是显著correlated，那么在这种情况下是否还能说一种方法的
预言一定好于
另一种方法呢？换言之，这时候这个个统计量的差值是否有统计的significance？

【在 D*******r 的大作中提到】

: 别的比赛不知道，但是就围棋比赛来讲，WHR的研究者以kgs上23万局的比赛记录来测试
: ，elo rating的预测准确率是55.121%，而WHR的预测准确率是55.793%。
: 从统计学上讲，如果algorithm A比algorithm B 的预测准确率高0.091%，就有95%的把
: 握说A比B预测得更准确。

D*******r
发帖数: 2323

这个predication准确率是说，某一算法预测它算出来等级分高的那方取胜，预测的正
确率占所有sample的比例。
因为sample都是同段位（级位）的分先对局，所以大部分对局棋手的等级分比较接近。
至于你说的“中心值difference"，不知道是指等级分相差范围多少以内的sample的结
果，还是说低段和高段的sample，不同算法算出来的difference有区别。
如果只是为了评价两种算法的优劣，可以专门对所有两种算法算出的对弈棋手的等级分
高低刚好相反的所有对局来统计，看看哪种算法得到的等级分高的一方最终赢棋的比率。

distribution

【在 p******e 的大作中提到】

: 我有个关于这个准确率的问题。我猜测这个准确率应该是在某种cross validation的方
: 法下算出来的
: 对于一定的sample的平均。那么既然是对于sample的评价，就应该有一个distribution
: 。换句话说。
: 这个准确率是有error bar的。那么如果这个error bar的size远大于他们中心值的
: difference，而且
: 这2种方法给出的error不是显著correlated，那么在这种情况下是否还能说一种方法的
: 预言一定好于
: 另一种方法呢？换言之，这时候这个个统计量的差值是否有统计的significance？

p******e
发帖数: 528

我的意思是这样的。
比方在同一段位总共有1000名棋手，我先取250名棋手，让他们对局，然后同两种不同
的rating系统
去预言胜率，再计算这两种系统预测的差值。然后再取250名棋手，如此反复。最有我
得到的是一个
关于这两种rating方法的预测准确率的difference的sample。这个sample应该是具有一
个distribution。
但是这个这个difference的distribution有可能是zero consistent的。换言之，任何
一个rating系统所
得到注册率的值不是一个值，而是一个分布。我觉得你举的那个例子中一次就用了所有
的1000名棋手，
所以原则上只是的到了一个对于预测准确率的difference的平均值，而无法知道这个
mean的分布的
宽度。

率。

【在 D*******r 的大作中提到】

: 这个predication准确率是说，某一算法预测它算出来等级分高的那方取胜，预测的正
: 确率占所有sample的比例。
: 因为sample都是同段位（级位）的分先对局，所以大部分对局棋手的等级分比较接近。
: 至于你说的“中心值difference"，不知道是指等级分相差范围多少以内的sample的结
: 果，还是说低段和高段的sample，不同算法算出来的difference有区别。
: 如果只是为了评价两种算法的优劣，可以专门对所有两种算法算出的对弈棋手的等级分
: 高低刚好相反的所有对局来统计，看看哪种算法得到的等级分高的一方最终赢棋的比率。
:
: distribution

(共1页)

进入Go版参与讨论

相关主题
● 试想一下中国棋手柯洁到底能不能战胜机器人	● 阿法狗只离柯洁12分之遥了
● LG 杯小组第三轮时越连笑出局	● 看了眼棋渣的微博
● 棋渣在3：5落后秀芝后，终于意识到当网红没啥意思了	● 李师师淬火重生后五连胜
● 柯洁要跟阿尔法狗下棋了？	● 据传——柯洁十月份大战Google的 AlphaGo
● 柯洁和李喆的反应都很正常	● 柯洁只领先阿法狗3分了
● 好多人说柯洁是世界第一，可是	● 看俩老外讲棋，对比国内讲棋，围棋东亚溃败早晚的事 (转载)
● 柯洁后半盘看来比较差	● 阿法狗给职业棋手们上了一课
● 古力对李师师是真爱啊	● 柯洁说不想和阿法狗下了

相关话题的讨论汇总
话题: 等级分话题: 棋手话题: 准确率话题: rating话题: 预测

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

boards

未名新帖统计// 7月16日

历史上的今天