w***9 发帖数: 804 | 1 围棋高手对决,其实是心理战。想方设法让对方出错吃亏,揪住不放,扩大战果。这种
方法对机器效果应该不是很好。
据内部人说,阿狗在走下一步之前,会选出一些热点,然后对热点进行深度计算,选出
最佳点。阿狗热点不可能是所有点,最大多少,应该是商业机密。热点扩散法就是尽量
脱先,全盘走,尽量扩大热点数,就是吃亏,也不可惜。我觉得只要超过了阿狗的最大
热点数,赢棋应该是可能的。 |
e*g 发帖数: 4981 | 2 我觉得就是这样。
或者这么说,如果只在一个地方跟狗斗,或者是在几个分别独立的地方跟狗斗,肯定没
戏。
最好就是多弄几个地方,把不同局部的关联度提上去,比如像征子就是个好办法。
当然这样人也不一定好下,但是可以试试。
【在 w***9 的大作中提到】 : 围棋高手对决,其实是心理战。想方设法让对方出错吃亏,揪住不放,扩大战果。这种 : 方法对机器效果应该不是很好。 : 据内部人说,阿狗在走下一步之前,会选出一些热点,然后对热点进行深度计算,选出 : 最佳点。阿狗热点不可能是所有点,最大多少,应该是商业机密。热点扩散法就是尽量 : 脱先,全盘走,尽量扩大热点数,就是吃亏,也不可惜。我觉得只要超过了阿狗的最大 : 热点数,赢棋应该是可能的。
|
t******l 发帖数: 10908 | 3 增加复杂度,出现狗咬狗 learn 也无法覆盖的情况(组合足够多,又不正交,那狗咬狗
的电费也不够不是?)。倒是有可能拖狗进读秒,或者增大狗出臭子的概率。
不过说起来容易,但人的计算力比不过狗的情况下,咋实施是个问题。
【在 w***9 的大作中提到】 : 围棋高手对决,其实是心理战。想方设法让对方出错吃亏,揪住不放,扩大战果。这种 : 方法对机器效果应该不是很好。 : 据内部人说,阿狗在走下一步之前,会选出一些热点,然后对热点进行深度计算,选出 : 最佳点。阿狗热点不可能是所有点,最大多少,应该是商业机密。热点扩散法就是尽量 : 脱先,全盘走,尽量扩大热点数,就是吃亏,也不可惜。我觉得只要超过了阿狗的最大 : 热点数,赢棋应该是可能的。
|
w***9 发帖数: 804 | 4 脱先,征子,应该还有对人简单,容易扩大热点的办法。
咬狗
【在 t******l 的大作中提到】 : 增加复杂度,出现狗咬狗 learn 也无法覆盖的情况(组合足够多,又不正交,那狗咬狗 : 的电费也不够不是?)。倒是有可能拖狗进读秒,或者增大狗出臭子的概率。 : 不过说起来容易,但人的计算力比不过狗的情况下,咋实施是个问题。
|
w***9 发帖数: 804 | 5 从前两个棋谱来看,阿狗有些下法不可思议,如果从减少热点的角度看,就非常合理。
现在关键是估算出爱狗是怎么选热点的。我估计已有棋子的3,5格内都是热点。边角的
常落子点也是热点。
【在 e*g 的大作中提到】 : 我觉得就是这样。 : 或者这么说,如果只在一个地方跟狗斗,或者是在几个分别独立的地方跟狗斗,肯定没 : 戏。 : 最好就是多弄几个地方,把不同局部的关联度提上去,比如像征子就是个好办法。 : 当然这样人也不一定好下,但是可以试试。
|
b*******8 发帖数: 37364 | 6 这话说的容易。看见对方脱先,就意味着本来我认为这里最大,他应该应一下,全盘没
有更大的。人应对脱先,最简单的方法就是还在这里惩罚你脱先,坚信我早先的判断,
不管别处你的收益。狗狗如果用这个策略,热点扩散就失效。要能奏效,必须下出能成
立的脱先,这就要超出对方的判断与计算。 |
w***9 发帖数: 804 | 7 你惩罚,我不应,继续脱先,扩大热点。这种脱先,肯定吃亏,对手是人,根本没用,
但是机器一旦热点超过最大值,应该有戏。
【在 b*******8 的大作中提到】 : 这话说的容易。看见对方脱先,就意味着本来我认为这里最大,他应该应一下,全盘没 : 有更大的。人应对脱先,最简单的方法就是还在这里惩罚你脱先,坚信我早先的判断, : 不管别处你的收益。狗狗如果用这个策略,热点扩散就失效。要能奏效,必须下出能成 : 立的脱先,这就要超出对方的判断与计算。
|
B**********r 发帖数: 812 | |
b*******8 发帖数: 37364 | 9 你脱先狗狗都不应,就惩罚,扩大什么热点?你这里都吃亏了,狗狗那里的胜率进一步
提高。
要按你说的扩大热点,根本不用脱先,一上来就到处乱下,没有棋形,美其名曰撒豆成
兵。
【在 w***9 的大作中提到】 : 你惩罚,我不应,继续脱先,扩大热点。这种脱先,肯定吃亏,对手是人,根本没用, : 但是机器一旦热点超过最大值,应该有戏。
|
o***8 发帖数: 46 | 10 什么热点,人家论文已经说得很清楚了, policy网是根据当前局面对每个合法落子位置
都做出评估,然后选若干点用蒙特卡罗树搜索往下算胜率。无论你怎么下,对这个过程
本身没有影响,根本谈不上什么扩大热点数。 |
h*h 发帖数: 27852 | |
P******a 发帖数: 1379 | 12 这个评估选出的热点万一把神之一手给剔除了呢?怎么下棋才能让狗狗不把最好的几手
选到热点里?
【在 o***8 的大作中提到】 : 什么热点,人家论文已经说得很清楚了, policy网是根据当前局面对每个合法落子位置 : 都做出评估,然后选若干点用蒙特卡罗树搜索往下算胜率。无论你怎么下,对这个过程 : 本身没有影响,根本谈不上什么扩大热点数。
|
t******l 发帖数: 10908 | 13 policy 网貌似是无逻辑型,但其关心的不是神之一手,而是痛扁人类选手。
因为人类选手本质都是根据过去棋谱学习发展的,只要不出现 revolution 的想法,任
何 evolution 的变化都会被狗痛扁,不是阿尔法狗就是贝塔狗。
:这个评估选出的热点万一把神之一手给剔除了呢?怎么下棋才能让狗狗不把最好的几
手选到热点里?
: |