关于左右互博 - Go版

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

Go版 - 关于左右互博

相关主题
● 预测下，经过这次大赛	● 日本人认为　学习围棋，死活最重要
● 慢棋也没戏	● (ZT)对我围棋帮助最大的一次谈话（一）
● 复盘时发现自己有一千种赢法	● 梅泽的定段原因
● 规则的失败——说一下我对“鲁金事件”的看法zz	● 聂卫平为什么这么说钱宇平？
● 我对死棋没有放回去的看法	● 你有专业水平吗？
● 打劫或成第三局首选策略	● 古力让业余一段20子能下吗？
● 狗的开发逻辑是不是这样？	● 棋手状态真重要啊
● 人工智能真正的缺陷在于“版本”	● 论证我的机会成本论的文章来了

相关话题的讨论汇总
话题: 算法话题: 评估话题: 围棋话题: 走法话题: 狗狗

进入Go版参与讨论

(共1页)

M*T
发帖数: 123

韩国棋院那个谁（忘了名字了）说阿狗左右互搏一万盘能提高很多，可一万到百万盘就
没啥作用了。这个我不太同意。他还是应用了人类思维的模式。人和自己下，不要说百
万盘，能到几千盘就没多大意义了，因为记忆有限，到了一定程度
就创新不出来了。
可狗狗不同，狗狗左右互搏凭机器记忆，上次这种情况左手输给右手了，这次铁定知道
，然后就换种走法了。不要说百万盘，就是千万盘，上亿盘照样能知道那种走法还没试
过。
这才是机器学习的威力。

s***y
发帖数: 198

还是这个问题，如果只有业余棋手的棋谱，阿发狗能自己博到什么高度？

【在 M*T 的大作中提到】

: 韩国棋院那个谁（忘了名字了）说阿狗左右互搏一万盘能提高很多，可一万到百万盘就
: 没啥作用了。这个我不太同意。他还是应用了人类思维的模式。人和自己下，不要说百
: 万盘，能到几千盘就没多大意义了，因为记忆有限，到了一定程度
: 就创新不出来了。
: 可狗狗不同，狗狗左右互搏凭机器记忆，上次这种情况左手输给右手了，这次铁定知道
: ，然后就换种走法了。不要说百万盘，就是千万盘，上亿盘照样能知道那种走法还没试
: 过。
: 这才是机器学习的威力。

M*T
发帖数: 123

比如一开始，狗左手模拟业余棋手赢得一方，右手模拟输的一方。
一旦得出右手这么走不行，就会不停地试验其他走法，不管优化不优化，
评估不评估，总之试验多了，总能找到赢过（或者开局占优）左手的走法。
然后就该反过来让左手试验各种变化了……
只要局数够多（例如million级），狗的水平是会无限提高的。

【在 s***y 的大作中提到】

: 还是这个问题，如果只有业余棋手的棋谱，阿发狗能自己博到什么高度？

n*****t
发帖数: 22014

互搏可以减少实时计算量，但下得再多，没人讲棋复盘，又有啥用？

【在 M*T 的大作中提到】

:
: 比如一开始，狗左手模拟业余棋手赢得一方，右手模拟输的一方。
: 一旦得出右手这么走不行，就会不停地试验其他走法，不管优化不优化，
: 评估不评估，总之试验多了，总能找到赢过（或者开局占优）左手的走法。
: 然后就该反过来让左手试验各种变化了……
: 只要局数够多（例如million级），狗的水平是会无限提高的。

t******l
发帖数: 10908

旁边楼上 PHD 不是说了，learning 阶段的神经网络根据大量结果总结（正向方向
fitting）出函数参数。
相当于复盘。

【在 n*****t 的大作中提到】

: 互搏可以减少实时计算量，但下得再多，没人讲棋复盘，又有啥用？

n*****t
发帖数: 22014

这种结果总结毫无意义，两个入门棋手的胜负完全说明不了棋的好坏

【在 t******l 的大作中提到】

: 旁边楼上 PHD 不是说了，learning 阶段的神经网络根据大量结果总结（正向方向
: fitting）出函数参数。
: 相当于复盘。

M*T
发帖数: 123

每一步的盘面评估（value 算法）就是狗狗自己给自己“讲”的棋了吧。复盘倒是没有
，不过重新下过n遍也就相当于某种复盘了。
另外刚才多想了一下，觉得狗狗这么干确实还是有瓶颈。就比如按照它现有评估算法，
败方试验了“最有胜率”的下法仍然输，这能代表前面胜方的下法就是“神手”吗，应
该不能吧？狗团队更可能的是反而会重新检视评估算法，认为其实是
算法有问题，并力图找出可以改进的地方。
而这次找人类顶尖棋手对决，估计八成也是遇到类似的情况，按照既有算法遇到部分棋
局怎么走都不赢，没法进化了。

【在 n*****t 的大作中提到】

: 互搏可以减少实时计算量，但下得再多，没人讲棋复盘，又有啥用？

t******l
发帖数: 10908

但两百万个一段棋手的胜负，培养出一个二段选手。
两百万个二段互殴。

【在 n*****t 的大作中提到】

: 这种结果总结毫无意义，两个入门棋手的胜负完全说明不了棋的好坏

n*****t
发帖数: 22014

关键就是评估，尤其转换之后外势相当于多少目这类问题，一流棋手都很难有定论，阿
狗的设计者就更不知道了。
所以我刚才说了，一百万个业余狗对杀，始终无法证明这个下法是对的，除非你把所有
变化都摆到了中盘，找出围棋最优解。而这是不可能的。

【在 M*T 的大作中提到】

:
: 每一步的盘面评估（value 算法）就是狗狗自己给自己“讲”的棋了吧。复盘倒是没有
: ，不过重新下过n遍也就相当于某种复盘了。
: 另外刚才多想了一下，觉得狗狗这么干确实还是有瓶颈。就比如按照它现有评估算法，
: 败方试验了“最有胜率”的下法仍然输，这能代表前面胜方的下法就是“神手”吗，应
: 该不能吧？狗团队更可能的是反而会重新检视评估算法，认为其实是
: 算法有问题，并力图找出可以改进的地方。
: 而这次找人类顶尖棋手对决，估计八成也是遇到类似的情况，按照既有算法遇到部分棋
: 局怎么走都不赢，没法进化了。

t******l
发帖数: 10908

算法不管对不对，算法只管在给定空间大概率赢，也就是达到算法目标的预期。
对不对是人类的事。

【在 n*****t 的大作中提到】

: 关键就是评估，尤其转换之后外势相当于多少目这类问题，一流棋手都很难有定论，阿
: 狗的设计者就更不知道了。
: 所以我刚才说了，一百万个业余狗对杀，始终无法证明这个下法是对的，除非你把所有
: 变化都摆到了中盘，找出围棋最优解。而这是不可能的。

相关主题
● 打劫或成第三局首选策略	● 日本人认为　学习围棋，死活最重要
● 狗的开发逻辑是不是这样？	● (ZT)对我围棋帮助最大的一次谈话（一）
● 人工智能真正的缺陷在于“版本”	● 梅泽的定段原因
进入Go版参与讨论

t******l
发帖数: 10908

从某种意义上，你也是对的，算法本质上无法创新，只能在“附近”搜索外推。
但问题在于，人类觉得一段跟十段差别巨大，但是天顶星人的数学家，搞不好
证明十段也就是在一段的“附近”，算法自行外推即可。

【在 n*****t 的大作中提到】

M*T
发帖数: 123

一百万个业余狗对杀，也许不能证明某个下法是“对”的，因为这时候水平差的还早，
但是一百万盘下来就是一百万次输赢。输赢不是“评估”，是铁的结果，这是最终极
的价值判断。只要这一百万盘下来能让狗狗————永远————不再下出某几种
要输的回应，那就是成长了吧。
而下一个一百万盘，就是在这个基础之上了。

【在 n*****t 的大作中提到】

n*****t
发帖数: 22014

电脑能搜索到的附近太小了，甚至都没有统计意义。靠穷举显然无法解决问题，围棋的
终极问题仍然是形势判断。

【在 t******l 的大作中提到】

: 从某种意义上，你也是对的，算法本质上无法创新，只能在“附近”搜索外推。
: 但问题在于，人类觉得一段跟十段差别巨大，但是天顶星人的数学家，搞不好
: 证明十段也就是在一段的“附近”，算法自行外推即可。

n*****t
发帖数: 22014

输赢，只是因为对手没有下出正确招法，100 万在围棋里还是太小了。

【在 M*T 的大作中提到】

:
: 一百万个业余狗对杀，也许不能证明某个下法是“对”的，因为这时候水平差的还早，
: 但是一百万盘下来就是一百万次输赢。输赢不是“评估”，是铁的结果，这是最终极
: 的价值判断。只要这一百万盘下来能让狗狗————永远————不再下出某几种
: 要输的回应，那就是成长了吧。
: 而下一个一百万盘，就是在这个基础之上了。

t******l
发帖数: 10908

你这个 “附近” 还停留在 K 班数数的层次。计算学上说的 “附近”，是可以在高维
拓扑空间、基于集合、还可以 smooth / massage function，所说的 “附近”。
其实任何一盘围棋，从开始到结束的全部过程，也就是某个高维空间里的一个点。
人类下过的所有的围棋，以及仨小时里想得出来的围棋，在那个高维空间是就是
一小撮的一小撮。而且你 naive 的看这个高维空间里相距很远的两个点，在
某些 topological xform 以后说不定就是邻居。

【在 n*****t 的大作中提到】

: 电脑能搜索到的附近太小了，甚至都没有统计意义。靠穷举显然无法解决问题，围棋的
: 终极问题仍然是形势判断。

(共1页)

进入Go版参与讨论

相关主题
● 论证我的机会成本论的文章来了	● 我对死棋没有放回去的看法
● 职业棋手对农心杯的看法	● 打劫或成第三局首选策略
● 拿冠军比不过房价飞涨古力无奈蜗居	● 狗的开发逻辑是不是这样？
● 从点目判断形势说起zz	● 人工智能真正的缺陷在于“版本”
● 预测下，经过这次大赛	● 日本人认为　学习围棋，死活最重要
● 慢棋也没戏	● (ZT)对我围棋帮助最大的一次谈话（一）
● 复盘时发现自己有一千种赢法	● 梅泽的定段原因
● 规则的失败——说一下我对“鲁金事件”的看法zz	● 聂卫平为什么这么说钱宇平？

相关话题的讨论汇总
话题: 算法话题: 评估话题: 围棋话题: 走法话题: 狗狗

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

boards

未名新帖统计// 7月16日

历史上的今天