t******g 发帖数: 4044 | 1 所谓神之一手。实际上这一步是否是最优解是否应该依赖于对手会如何应对?是否该假
设对手也是围棋之神?
或者说极端情况下两个真正的围棋之神是不是应该第一步棋下完,另一方就投子认负?
如果存在这个最优解,是不是数学上第一步一定是天元? |
g*********e 发帖数: 14401 | 2 为什么一定是天元?
【在 t******g 的大作中提到】 : 所谓神之一手。实际上这一步是否是最优解是否应该依赖于对手会如何应对?是否该假 : 设对手也是围棋之神? : 或者说极端情况下两个真正的围棋之神是不是应该第一步棋下完,另一方就投子认负? : 如果存在这个最优解,是不是数学上第一步一定是天元?
|
g***n 发帖数: 14250 | 3 天元显然是第一步里最差的选择,几乎相当于放弃了先手
最优解就是神仙来了也占不了你优势
当然解往往不止一步,有时候是连续几步才构成最优解 |
l****g 发帖数: 5080 | 4 没有最优解。这因为每个棋子的作用不仅取决于当前的棋子,还取决于以后的棋子。一
步晕招,如果对手以更晕的招法应对,这个晕招带来的收益可以比不那么晕的招法更大
的收益。因为没法预测未来,所以也不存在这种意义上的最优解。
除非你的对手不会出晕招。如果那样,每盘棋的输赢必定是一样的。而且这样的两位棋
手必定可以赢任何人,除非这个人也能 达到一样的输赢。不过这样一来,围棋也没意
思了。不用和对手下棋,和这位最佳棋手下就够了。 |
D*******r 发帖数: 2323 | 5 最优解应该这么定义:在任意局面下,从形势落后的一方的角度出发,从当前应手到终
局的所有次序及位置的变化组合中,结果是双方占地差距最小,能带来这样的结果的当
前一手可以成为最优解,所谓的“神之一手”。
最优解可能是唯一解,也可能是多个解。
【在 l****g 的大作中提到】 : 没有最优解。这因为每个棋子的作用不仅取决于当前的棋子,还取决于以后的棋子。一 : 步晕招,如果对手以更晕的招法应对,这个晕招带来的收益可以比不那么晕的招法更大 : 的收益。因为没法预测未来,所以也不存在这种意义上的最优解。 : 除非你的对手不会出晕招。如果那样,每盘棋的输赢必定是一样的。而且这样的两位棋 : 手必定可以赢任何人,除非这个人也能 达到一样的输赢。不过这样一来,围棋也没意 : 思了。不用和对手下棋,和这位最佳棋手下就够了。
|
t******g 发帖数: 4044 | 6 我想了下,把下棋想象成一个状态树的话,最后总的棋局最终状态数假设是N,每下一
招棋后,总的最终棋局的状态树就在减少。所谓最优解,就是下过这招后,使得剩下的
终局可能性自己胜的比例最高。
但是,招法选择并不只考虑终局状态胜率比例,而是尽量引导对方走向这样一条路径,
即此招过后,无论对方如何应招,己方都可以走向必胜的状态。这样一招,即使不是状
态树比例上的最优,也应该下。
【在 l****g 的大作中提到】 : 没有最优解。这因为每个棋子的作用不仅取决于当前的棋子,还取决于以后的棋子。一 : 步晕招,如果对手以更晕的招法应对,这个晕招带来的收益可以比不那么晕的招法更大 : 的收益。因为没法预测未来,所以也不存在这种意义上的最优解。 : 除非你的对手不会出晕招。如果那样,每盘棋的输赢必定是一样的。而且这样的两位棋 : 手必定可以赢任何人,除非这个人也能 达到一样的输赢。不过这样一来,围棋也没意 : 思了。不用和对手下棋,和这位最佳棋手下就够了。
|
a****t 发帖数: 7049 | 7 最优文章里就说了,是minimax优化的结果
比如只有两步,每步两个选择的游戏,状态树是这样的
o root
| |
a+ b +
| | | |
c d e f
| | | |
0 1 1 0
包括初始状态在内一共七个状态,最终状态的四个里两个是先手胜(1标记),两个是
先手败(0标记)。
那么先手可以选择的两步价值都一样,都是对手的最优价值(0),所以最终都会输。
如果状态树是这样的
o root
| |
a+ b +
| | | |
c d e f
| | | |
1 1 0 0
那么a状态的后手价值是1,b状态的后手价值是0,先手选最优走a。
可见每个棋盘终态都可以这样往回退,走出每个局面的最优。这里面没有任何“可能性
”和“不确定”可言。
用可能性只是由于无法穷举算minimax解,用统计值(比如某种中值)来估算。统计值
当然不是最优值,所以会出错,但这是没办法的。阿法狗已经企图用真人走棋的偏向来
估算最优值了。
【在 t******g 的大作中提到】 : 我想了下,把下棋想象成一个状态树的话,最后总的棋局最终状态数假设是N,每下一 : 招棋后,总的最终棋局的状态树就在减少。所谓最优解,就是下过这招后,使得剩下的 : 终局可能性自己胜的比例最高。 : 但是,招法选择并不只考虑终局状态胜率比例,而是尽量引导对方走向这样一条路径, : 即此招过后,无论对方如何应招,己方都可以走向必胜的状态。这样一招,即使不是状 : 态树比例上的最优,也应该下。
|
S*E 发帖数: 3662 | 8 假如黑棋选手掌握围棋最优解,开局时在他眼里棋盘每个交叉点都有一个数,
表示如果他落子在那里以后如果对手完全应对正确,黑方能够围到的面积。
然后他选取数字最大,记为N1,的一个点落子。这样的点可能不止一个。
如果他不在数字最大的点落子,那么就没有实现最优解。
然后轮到白棋。如果白棋选手也掌握了最优解,那他也看到每个交叉点上
有一个数字,代表如果白棋落子那里,最后黑棋能够围到的面积。
其中最小数的所在是白棋下一步的最佳着棋点。这个最小数必然是N1。
如果白棋没有掌握最优解,他很可能在一个比N1大的数,记为N2的地方落子。
然后再轮到黑棋。这时候黑棋选手看到的最大的数就变成了N2。落子那里
以后,最后黑棋至少能围到的面积是N2。如此交替行棋,黑棋优势逐步扩大。
【在 t******g 的大作中提到】 : 所谓神之一手。实际上这一步是否是最优解是否应该依赖于对手会如何应对?是否该假 : 设对手也是围棋之神? : 或者说极端情况下两个真正的围棋之神是不是应该第一步棋下完,另一方就投子认负? : 如果存在这个最优解,是不是数学上第一步一定是天元?
|
a****t 发帖数: 7049 | 9 不用选围到面积最大,只要选终盘是赢的。能算到赢几目当然也能算到赢还是输了。尤
其当不能穷举而是要靠中值估算来判断棋盘价值时,用赢的目数作为终盘价值是很危险
的,很可能是大量小输+小量大赢的混合。所以一种改进是加入方差的估算,一起存在
树里,不知道为什么狗家没有考虑到。
【在 S*E 的大作中提到】 : 假如黑棋选手掌握围棋最优解,开局时在他眼里棋盘每个交叉点都有一个数, : 表示如果他落子在那里以后如果对手完全应对正确,黑方能够围到的面积。 : 然后他选取数字最大,记为N1,的一个点落子。这样的点可能不止一个。 : 如果他不在数字最大的点落子,那么就没有实现最优解。 : 然后轮到白棋。如果白棋选手也掌握了最优解,那他也看到每个交叉点上 : 有一个数字,代表如果白棋落子那里,最后黑棋能够围到的面积。 : 其中最小数的所在是白棋下一步的最佳着棋点。这个最小数必然是N1。 : 如果白棋没有掌握最优解,他很可能在一个比N1大的数,记为N2的地方落子。 : 然后再轮到黑棋。这时候黑棋选手看到的最大的数就变成了N2。落子那里 : 以后,最后黑棋至少能围到的面积是N2。如此交替行棋,黑棋优势逐步扩大。
|
s******n 发帖数: 6806 | 10 下棋是完美信息完全信息的博弈,不能说最优解,应该说是找到nash均衡。它不存在随
机因素,所以完全可以确定最终双方目数差。
均衡解也就是最终黑应当贴的目数,这个值是一定的。但是双方解的路径可以很多种。
在某一个棋局下可选的落子点可以有几个,但随便选那个都可以,只要双方后面都足够
聪明,下自己均衡解中的策略,最终目数差绝对是个定值。
任何一方偏离自己的均衡解策略,都会被惩罚,目数差就会变化。 |
t******g 发帖数: 4044 | 11 嗯,从你举的例子来看,第一种情况表面看起来无论走a还是b,终盘状态都是50/50状
态是先手胜,而实际上如果后手应对正确,先手其实败局已定。
计算机是不是在这种情况下就会投棋认负?而实际上后手可能根本没看出来哪步棋会赢
,但计算机会假设对手都算清楚了?
【在 a****t 的大作中提到】 : 最优文章里就说了,是minimax优化的结果 : 比如只有两步,每步两个选择的游戏,状态树是这样的 : o root : | | : a+ b + : | | | | : c d e f : | | | | : 0 1 1 0 : 包括初始状态在内一共七个状态,最终状态的四个里两个是先手胜(1标记),两个是
|