D*******r 发帖数: 2323 | 1 那是他对人类棋手,因为他知道他的对手比他对转换得失的判断还差,所以他敢劫争。
包括对小李爱僵尸流,爱翻盘的理解也是这样,小李祭出僵尸流,以他自己的算路都已
经可以算出不成立,他之所以敢弄出来,是欺负对手算不过他,会算错。而面对阿法狗
,小李自己都算出不行的手段,还敢拿出来吓阿法狗?不是等着被打脸么? |
|
M*******p 发帖数: 5626 | 2 第二盘后,韩国围棋队总教练刘昌赫就还是有些不服气:
“ 比赛结束后,韩国棋手刘昌赫九段评价说:“‘阿尔法围棋’下了很多怪手,如
果李世石按照自己的棋风果断地应对,他或许会赢。但是,李世石在很多局部战斗中,
没有按自己的棋风果断下棋,好像他在心理上有所畏缩。看上去,‘阿尔法围棋’棋行
有些弱,但是它判断形势和计算的能力很强。在官子阶段上,‘阿尔法围棋’占尽优势
。”
而且,我昨天也贴过李世石师傅权甲龙看了第一盘的评价,也是认为石头自己的“因素
”导致了他的失败。
阿法狗是个新东西,下在棋盘上的东西有不少现在棋手没看懂,而且有些招法很难说就
是最佳(比如昨天粘上两子跑出来),所以顶尖高手当然会有一些看法了,想上去试一
下的也不在少数,我估计中日韩都有。难不成看到阿法狗赢了石头两盘后想去挑战一下
的勇气都没有了? |
|
l*****y 发帖数: 58 | 3 阿法狗应该和李世乭复盘啊。这是职业对局的基本要求吧。
李世乭摆变化,阿法狗显示自己认定的各点胜率。 摆到李世乭自己累为止。
否则的话对李世乭太不公平 |
|
v*********u 发帖数: 10464 | 4 根本就不存在谷歌的中国表示,阿法狗顶多是条哈巴狗,哈哈哈哈
我代表中国人灭了阿法狗 |
|
D*******r 发帖数: 2323 | 5 哈哈,据说阿法狗的设定是胜率低于10%就会认输。阿法狗对着棋盘上五个黑子一算,
胜率怎么都到不了10%,遂认输。 |
|
D*******r 发帖数: 2323 | 6 杀大龙有一些其实计算未必复杂,但是需要手数很多,而机器是没法通过棋形判断死活
的,它必须一直摆到对方没气时,才能确认能杀棋。
但是蒙特卡罗搜索不能一直往深处搜索,那样计算量太大。于是假设一条大龙需要30手
棋才能收完气杀死,但是阿法狗算了25手,对方大龙还没死,于是它就误以为大龙杀不
死,于是放弃那条搜索路线。
这么多盘棋,阿法狗虽然力量强大,但是却从不杀大龙,可能就是这个原因。 |
|
a**h 发帖数: 2150 | 7 3:2,5:0是一样的赢,杀大龙和赢半目也一样。
而3:2和4:1赢比5:0从大局战略上强太多了,
阿法狗及其团队的终极胜利是,项目得到更大关注,继续得到谷歌资助进行下去。现在
有弱点,人类还有希望,将来还会有人机比赛。如果5:0获胜,彻底摧毁对手信心,已
经没有意义再下了,比如深蓝之后,国际象棋再也没有人机大赛了。 |
|
D*******r 发帖数: 2323 | 8 79手的误算到87手反应过来时,瞬间情绪失控,发疯似地走了左下角的挖。
过了一会儿似乎冷静下来,又开始耐心收官,等待李世石犯错,并且利用李世石求稳心
理,小占了点便宜把差距缩小。这段时间阿法狗的官子完全正确。到了最后,实在无望
了,又开始损官子,然后很快就认输了。
这整个过程和人类在下棋时打了个勺子时,是完全一样的。我们固然知道,计算机的反
应一切都是基于计算的基础上,但是,怎知人类的情绪感情不是大脑计算结果带来的反
应?
比如说,大脑目标本来是要和女朋友滚床单,结果因为某天打了个勺子(惹女朋友不高
兴了),女朋友要求分手,大脑计算如果分手后还能和女朋友滚床单的概率下降到10%
以下,于是情绪崩溃,指示身体跑去给女朋友下跪求饶等发疯举动。然后过一阵子,意
识到天涯何处无芳草,又重新冷静下来继续收官。 |
|
D*******r 发帖数: 2323 | 9 就是这个意思,但是当它猛然发现自己的计算出现巨大漏洞,胜率陡降时,如何能避免
“地平线效应”去走损手,这是下一版的阿法狗的重大课题。 |
|
D*******r 发帖数: 2323 | 10 罗洗河说,围棋一方如果不许打劫,相当于让了对手四子。
而我们看到了,阿法狗几乎从不主动挑起劫争,遇上对方开劫,往往很快让劫。虽然没
有人规定它不许打劫,但是客观上它等于是放弃了打劫的权利。
放弃打劫权利,等于让对手四子,还能够碾压顶尖棋手的阿法狗,得算多少段? |
|
y********n 发帖数: 4452 | 11 我个人看了一下阿法狗的paper,里面吹嘘没有写任何围棋的规则,全都是棋谱里和实
战学的。我产生了这个问题:
研究AI的可不可以解释一下。它怎么知道算双方的气数,哪里开始紧气会赢?
如果像国际象棋一样,走policy network给的那些选择走,只是直觉,走个50步,然后
feedback/
value policy给个分数,那其实阿法狗还是不会下围棋。
或者说feedback/value policy会算气,知道这块棋是死是活,它又是怎么算出来的呢
,不是要走很多步才明朗嘛,走50步后有些地方死活不知,还没走完value policy怎么
可能算的出来赢率呢? |
|
y********n 发帖数: 4452 | 12 个人的感觉是value network里每块棋都是back propagate的赢率。所以根本没有算气
,这块气死活已经populated。也就是说这样的棋形以前玩过,所以还没走完就知道死
活。
可是这个有几个问题,一个是数据量巨大,把计算转换成storage,search量也非常大
。导致AI只能做一件事,不能贯通知识到其他领域。
第二个问题是致命的,就是复杂一点的棋形,那判断就会出错,因为这种棋形的例子实
在太少。譬如第4盘的挖这手触动4方的棋形,早一点,阿法狗根本算不出来,第一因为
它不会算,value network不会算几块棋互相关联的赢率。要走很多步所有的棋块都明
朗了它才可以分开算对。还有它没有把挖那一手作为重要一手,可能走几步就淘汰掉了
,所以没有算穷那几块棋的最终结果。
所以人和电脑下,不要怕复杂,特别是到处棋块都会互相牵引的那种复杂性,也就是说
一盘棋没有各个板块的独立性,动一处可以引发全动的那种复杂,阿法狗应该算起来应
该非常困难。
个人浅见,抛砖引玉,请专家多多发言。 |
|
|
w***9 发帖数: 804 | 14 把棋子往棋盘上随手扔。
每次的位置,肯定都是棋谱上没有的,阿法狗都要从头算,最后时间不够,只好认输。 |
|
d*********u 发帖数: 2952 | 15 如果算法里有模式识别的东西,都应该有机会陷入局部缺陷的。
因此 我老认为
通过对此狗的算法分析 人类还是可以战而胜之的。
就好比照片识别
你把人像的鼻子割掉,识别率还是100
但把照片放玻璃下面 识别率就只有60
阿法狗估计也是有缺点的。 |
|
d*********u 发帖数: 2952 | 16 这个和目标设定没关系。
目标是美好的,但需要实现。
这算法目前还是存在明显的不足的。
如果让李下前盘 后盘交给另一个阿法狗 则李方必赢。
所以你说的恰好相反
只要李能最大利用这不足,将优势扩大到半目即可。 |
|
w*********r 发帖数: 42116 | 17 昨天听广播,一男一女两个主持讲阿法狗和李世石的比赛。那个男的说早上花了10分钟
学习了一下围棋,很好理解、很容易。那个女的接话说电脑教的。 |
|
p***r 发帖数: 4702 | 18 阿法狗不背题,原理很简单,就是几万个个知道围棋规则的人永远不会死,每天就是不
停地对下,然后总结经验。经验是啥人不懂,但是他们懂。刷了几万年,就都是棋圣了。
跟网上围棋对战出来后中国青少年水平迅速提高一个道理。只不过计算机永远不老不死
。这你就没法破。 |
|
s****i 发帖数: 5144 | 19 最好是人不限时,这样阿法狗一盘都赢不了。当然,一盘也输不了。 |
|
v*********u 发帖数: 10464 | 20 根本就不存在谷歌的中国表示,阿法狗顶多是条哈巴狗,哈哈哈哈 |
|
|
s*******u 发帖数: 9508 | 22 刚开始的几个子, 阿法狗总是很慢,而后面则快很多,为啥? |
|
G**L 发帖数: 22804 | 23 其实围棋就是给老中扯淡YY用的,所谓琴棋书画,都是文青的标志。这个阿法狗屁风情
木有,简直有辱斯文 |
|
h******k 发帖数: 15372 | 24 百度还没拿到阿法狗弟弟的源代码吗?怎么还没动静 |
|
|
s*****r 发帖数: 43070 | 26 阿法狗的成果会应用到很多产品,狗内现在AI大热啊 |
|
s*****r 发帖数: 43070 | 27 阿法狗的成果会应用到很多产品,狗内现在AI大热啊 |
|
S*******n 发帖数: 10009 | 28 围棋有规则,股市没有。就象下1999x1999的围棋,阿法狗没法穷尽。 |
|
S*******n 发帖数: 10009 | 29 围棋有规则,股市没有。就象下1999x1999的围棋,阿法狗没法穷尽。 |
|
|
y********n 发帖数: 4452 | 31 感觉AI还在非常初期的阶段。阿法狗根本不会下围棋,只是用了个policy network剪了
很多不必要的branch的下子点,再用穷算算了几十部后的局势而已。
其他玩游戏都是overfitting,因为每个游戏的重复性非常高,所以根本不是AI,是每
步都乱走,然后走对了,就采用,慢慢的一步步破关。
AI可以做的很expert,不过要hardcode很多东西,不可以只用神经系统就可以了。 |
|
|
y********n 发帖数: 4452 | 33 你说哪方面强了,如果是围棋的话,其实主要进步还是用了monte carlos. 阿法狗用的
服务器可是deepblue的几千倍都不止了吧。tree的宽度减少,服务器的运算速度大幅提
高,其他看不出啥提高。
如果说图像辨识,其实不是AI,我觉得更像fussy logic的image comparison,根本谈
不上是智能。
|
|
P****a 发帖数: 1348 | 34 阿法狗好像不只是优化的穷举了吧,另外打分打的好就够牛了。
tree |
|
y********n 发帖数: 4452 | 35 说到具体讨论的问题,guvest和老马只会吹嘘自己多厉害,论文看的多么多,我说的多
肤浅。然后说了半天,自己对于阿法狗的强项弱点一点见解都不写,呵呵呵,谈到细节
,就露馅儿了。 |
|
t******y 发帖数: 6206 | 36 阿法狗还没有达到真实的超智商,但是对于干翻人类这种低智力物种,已经绰绰有余了。 |
|
o*****p 发帖数: 2977 | 37
我认为恰恰相反。如果棋盘改变了,阿法狗必胜。因为他自己可以和自己下几千万盘
,迅速的积累经验。人要一点点学习。别忘了人类玩围棋已经玩了两千年。现在是用
2000年的积累和计算机下。你认为这经验归0,是对计算机影响大还是对人影响大?
现在是比智力又不是比功耗。 |
|
D*******r 发帖数: 2323 | 38 一个“失误”是优势情况下的走法不是最佳亏损了目数,这个问题已经说过很多遍了,
不再重复。
另一个阿法狗总被诟病的是不懂得保留,这些人不懂的保留是人类棋手的特征,人类棋
手因为算不清,也因为当前局面比较开阔,为以防将来局势的各种变化而把一些可以定
型的地方暂时保留以备将来根据局面采取不同的定型方法。而对于计算机来讲,能定型
的地方它都会尽快定型,它的目标是尽快减小棋盘,减少局面变化的变数,因为定型越
多,棋盘越小,它的计算量会几何级数般地减少,它对局面判断也就越准确,所以“不
懂保留”根本就是计算机的目的,而不是什么失误和缺陷。 |
|
q*****C 发帖数: 114 | 39 如果真是这样,那么我可以推论出来,阿法狗所谓的练习了上亿盘棋局,其实是假的,
因为它学习的时候不是真的模拟跟真人过招的棋局。当然,即使这样,它还是能进步,
能够丰富它的数据库和修正其算法参数,但是如果说跟人一样通过下真实的棋积累经验
,它其实没有那么多盘的棋力。
我的两分钱。 |
|
D*******r 发帖数: 2323 | 40 不同版本的阿法狗也是在神经网络的train的version不同而已,不是蒙特卡罗搜索的版
本不同。 |
|
q*****C 发帖数: 114 | 41 是,规则上说就不是一对一了。
但是,我也可以argue说阿法狗本身就不是“一个选手”在下棋啊。而且,更进一步说
,这说明AI其实还是赢不了人类思维的 teamwork 啊。
我小白,轻拍 :) |
|
D*******r 发帖数: 2323 | 42 你这么想吧,阿法狗左右互搏相当于职业棋手平时在网上下大量的10秒,20秒的超快棋
,它是为了培养棋感,而不是依靠计算的训练棋。
算。 |
|
D*******r 发帖数: 2323 | 43 小李本来想给阿尔法狗玩一盘功夫棋,结果被阿法狗带上了复杂的收官路。 |
|
D*******r 发帖数: 2323 | 44 孟泰龄昨天微博还吹牛逼说有信心让阿法狗先。
柯洁底下回复:你可能比它强一点,但是让先让不了。
现在看完两盘后,孟孟不知道啥感想? |
|
D*******r 发帖数: 2323 | 45 看了柯洁的解说,不得不说柯洁的棋感高出其他一众职业,两盘都是他第一个觉出李世
石不行的。
但是,我说的是,阿法狗左下粘两子以后,被白吃两子,而黑只得一个“漏洞百出,破
破烂烂”的外势时,柯少也是断然判断黑大亏的。真的是大亏吗?人类的判断可靠吗?
吴清源当年在日本祭出新不局,日本棋界也是觉得他的或者匪夷所思,或者大亏,但是
下着下着,那些大亏的应手全成了好棋。 |
|
c*****t 发帖数: 10738 | 46 阿法狗对每一步的Tree Search本来就是算到局底的。 |
|
l*******e 发帖数: 1869 | 47 是啊,当年毛泽东之所以被当作战略家称赞,就在于他经常能够放弃局部的得失,而进
行全盘大局的运筹。
其实计算机下棋从来都是这样的,我在和一些低档的计算机程序对局的时候,对方就常
脱先去找计算出来的所谓更好的点,虽然那些程序比阿法狗要差十万八千里,但是也说
明了计算机会严格冷静地按照原则去下棋,而不会感情用事。 |
|