由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Go版 - 推测狗的败因
相关主题
柯洁还是服了comments on halfsea vs berklai
Nature重磅封面:谷歌人工智能击败欧洲围棋冠军围棋官子中的数学:什么情况下是单先官子?
我来总结一下吧,AlphaGo 其实根本赢不了顶尖棋手2008 丰田杯东赛区参赛记 (5) (angryfist)
仔细想了一下,阿法狗的算法在劫争上完全没有漏洞你们也别老讨论职业的了
alphago 开放接口这几天重温马晓春的笑傲纹枰
阿法狗第四局最终并不是输在对妙手的漏算上请教黑1的作用。
看来alphago也会有漏算的地方既然是没有奖品的友谊赛
master 布局一般 中盘厉害建议:设"最佳着手赏"
相关话题的讨论汇总
话题: 漏算话题: 导致话题: alphago话题: 减枝话题: bug
进入Go版参与讨论
1 (共1页)
H******u
发帖数: 332
1
观察到这局狗用时缩短明显,在下到中盘要点处,也是比较快落子,有几个推测,
1.夏时制引起的分布式系统紊乱,反正我公司每年这时候都一副严阵以待的架势,去年
时钟有一次加一秒,有一个server就出了错误,unix的系统,这次下到70几手的时候,
就是美东2:00左右,我以前发帖说过几次,如果制胜妙手在十几手之外,并且导致这个
妙手的局面被认为不值得深算而被减枝,那么漏算就会出现,从而导致失败;另一种可
能的减枝是某些计算节点失效,以至于不能返回正确结果给决策节点,进而导致剪枝,
狗发疯那一段很可能是技术原因导致的,
2.人为的礼貌性的让一局,这个技术上很容易做到,比如可以把一些参数写到一个
config file里,每次启动狗,就去读那个file,我能想到调整的参数是:决定要不要
把这一局面摆到底的搜索深度,如果这个深度浅的话,那么漏算可能性大大增加,用时
则大大减少,从观察来看,这局狗下得比较快,这种可能存在,3:0之后让李世石胜一
局,很多人都会得利,这最终是人与人的游戏,局后的记者会不是皆大欢喜的场面吗?
o*****p
发帖数: 2977
2
正好在神之一手之后崩溃,这是影帝的觉悟。
崩溃后开始18k,这是影渣的表现。
不用想了,肯定是bug出来了。
这次是来不及修复了。因为产生结果的是整个神经网络。
这种根深蒂固的bug,要改进就要完全重新训练一个网络。当然这也不是难事。

【在 H******u 的大作中提到】
: 观察到这局狗用时缩短明显,在下到中盘要点处,也是比较快落子,有几个推测,
: 1.夏时制引起的分布式系统紊乱,反正我公司每年这时候都一副严阵以待的架势,去年
: 时钟有一次加一秒,有一个server就出了错误,unix的系统,这次下到70几手的时候,
: 就是美东2:00左右,我以前发帖说过几次,如果制胜妙手在十几手之外,并且导致这个
: 妙手的局面被认为不值得深算而被减枝,那么漏算就会出现,从而导致失败;另一种可
: 能的减枝是某些计算节点失效,以至于不能返回正确结果给决策节点,进而导致剪枝,
: 狗发疯那一段很可能是技术原因导致的,
: 2.人为的礼貌性的让一局,这个技术上很容易做到,比如可以把一些参数写到一个
: config file里,每次启动狗,就去读那个file,我能想到调整的参数是:决定要不要
: 把这一局面摆到底的搜索深度,如果这个深度浅的话,那么漏算可能性大大增加,用时

H******u
发帖数: 332
3
我始终理解为漏算,各种原因导致的漏算,
78及其后续手段的漏算,狗在87左右才意识到,这个漏算大约发生在约20手之前,

【在 o*****p 的大作中提到】
: 正好在神之一手之后崩溃,这是影帝的觉悟。
: 崩溃后开始18k,这是影渣的表现。
: 不用想了,肯定是bug出来了。
: 这次是来不及修复了。因为产生结果的是整个神经网络。
: 这种根深蒂固的bug,要改进就要完全重新训练一个网络。当然这也不是难事。

Y***C
发帖数: 249
4
我觉得是程序本身的缺陷。Alphago领先时好下,它只要假设对手走最好的棋,自己也
最稳定的应对就行了,这也是它看起来永远比人类对手高一点的原因,因为它不会看人
下菜碟,下无理棋,它严格自求用最稳妥的方式获胜。但落后时alphago的缺陷就暴露
了。如果是人类对手,落后时一定得选择策略,对官子不行的,就不着急,耐心磨,等
待对手最后犯错误。如果对手官子很强,就尽早放胜负手。但Alphago显然不是这样想
的。尤其到了收官时表现得更明显。一路扳的两个应手,对业余棋手是好棋,可能吓住
对方或诱惑对方犯错误,但对职业棋手,是绝对坏棋,因为对方肯定不会应对错。这种
逻辑,alphago显然还没有。所以一旦真的落后,它的计算里面对方可以获胜,就乱套
了。
K**********o
发帖数: 108
5
这还用推测,程序有bug呗。
就好比你打星际跟电脑打,一开始不知道,跟程序比微操,所以每次都输。
后来发现程序有bug,利用bug,每次都轻松赢。
alphago要是能开放让各路棋手测试,证明没有bug,才算是真正的战胜人类。
否则就下几盘还算不上。
t**d
发帖数: 6474
6
下出两个假金鸡独立,无论是什么原因输棋,都不重要了。

【在 H******u 的大作中提到】
: 观察到这局狗用时缩短明显,在下到中盘要点处,也是比较快落子,有几个推测,
: 1.夏时制引起的分布式系统紊乱,反正我公司每年这时候都一副严阵以待的架势,去年
: 时钟有一次加一秒,有一个server就出了错误,unix的系统,这次下到70几手的时候,
: 就是美东2:00左右,我以前发帖说过几次,如果制胜妙手在十几手之外,并且导致这个
: 妙手的局面被认为不值得深算而被减枝,那么漏算就会出现,从而导致失败;另一种可
: 能的减枝是某些计算节点失效,以至于不能返回正确结果给决策节点,进而导致剪枝,
: 狗发疯那一段很可能是技术原因导致的,
: 2.人为的礼貌性的让一局,这个技术上很容易做到,比如可以把一些参数写到一个
: config file里,每次启动狗,就去读那个file,我能想到调整的参数是:决定要不要
: 把这一局面摆到底的搜索深度,如果这个深度浅的话,那么漏算可能性大大增加,用时

d*****n
发帖数: 754
7
没觉得。狗一直下得很强。后面的失误是狗确实算不了那么深。计算不够的情况下,形
势判断是没用的。而职业高手在必要的情况下是可以算得很深的。

【在 H******u 的大作中提到】
: 观察到这局狗用时缩短明显,在下到中盘要点处,也是比较快落子,有几个推测,
: 1.夏时制引起的分布式系统紊乱,反正我公司每年这时候都一副严阵以待的架势,去年
: 时钟有一次加一秒,有一个server就出了错误,unix的系统,这次下到70几手的时候,
: 就是美东2:00左右,我以前发帖说过几次,如果制胜妙手在十几手之外,并且导致这个
: 妙手的局面被认为不值得深算而被减枝,那么漏算就会出现,从而导致失败;另一种可
: 能的减枝是某些计算节点失效,以至于不能返回正确结果给决策节点,进而导致剪枝,
: 狗发疯那一段很可能是技术原因导致的,
: 2.人为的礼貌性的让一局,这个技术上很容易做到,比如可以把一些参数写到一个
: config file里,每次启动狗,就去读那个file,我能想到调整的参数是:决定要不要
: 把这一局面摆到底的搜索深度,如果这个深度浅的话,那么漏算可能性大大增加,用时

b*******i
发帖数: 594
8
我倾向于分布系统紊乱造成的昏招迭出。
即使对白78有漏算,后面的胡下也是毫无道理的。我不太相信google测试程序的时候会
不测试局面落后的状况,我觉得有可能是分布系统的bug造成程序“以为”自己还占据
优势从而乱来,而不是算法的问题。还是看看今天的对局结果如何。
1 (共1页)
进入Go版参与讨论
相关主题
建议:设"最佳着手赏"alphago 开放接口
呼吁为MKL正名阿法狗第四局最终并不是输在对妙手的漏算上
做题----MKL训练之一(2)看来alphago也会有漏算的地方
出一道小题,版主发包子用master 布局一般 中盘厉害
柯洁还是服了comments on halfsea vs berklai
Nature重磅封面:谷歌人工智能击败欧洲围棋冠军围棋官子中的数学:什么情况下是单先官子?
我来总结一下吧,AlphaGo 其实根本赢不了顶尖棋手2008 丰田杯东赛区参赛记 (5) (angryfist)
仔细想了一下,阿法狗的算法在劫争上完全没有漏洞你们也别老讨论职业的了
相关话题的讨论汇总
话题: 漏算话题: 导致话题: alphago话题: 减枝话题: bug