我对AlphaGo的理解 - Stock版

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

Stock版 - 我对AlphaGo的理解

相关主题
● google太牛了，	● AMD breaking news tonight after market close
● 大家去围棋班赌google跟李世石的世纪大战吧	● 买nvda就是买deep learning
● NVDA 增长的一个新问题	● nvda没有跌的基础
● 按摩店还是有点盼头的	● Russian murder killing friend over AMD vs Nvidia argument
● 两个问题给当代股民浇盆冷水	● nvda腾讯签约，腾讯的AI用NVDA的GPU.
● xeon phi就是翔啊	● NVDA自动驾驶市场有多大？
● nvidia: tomorrow the day for fermi?	● NVDA新增长点，NVIDIA Metropolis
● 阿曼达稳稳地奔翻倍去了	● AWS开始推出Volta

相关话题的讨论汇总
话题: alphago话题: 走子话题: 走棋话题: 网络话题: 围棋

进入Stock版参与讨论

(共1页)

y********n
发帖数: 4452

我喜爱围棋，在大学也进修过人工智能。之前我觉得谷歌狗不可能赢李。然后在第一局
后还觉得李没有把水平发挥出来。看了第二局，我才知道根本没有人可以赢谷歌狗，包
括中国任何选手或群体。
之前我大大低估了现在电脑组的运算能力，现在才知道当今电脑组运算的恐怖速度。其
实布局不是那么重要，电脑只是不沾下风就可以了，它运用以前的棋谱，算出在什么地
方下最有可能性，然后才在那里模拟，选出最保守最不臭的一棋。所以布局期间虽然漏
洞百出，不过没有马上致命的问题就可以了。因为围棋步数太长，开始的时候电脑也运
算不到最后结果，所以只要跟上步伐就可以了。算到时间允许，没有失地就可以了。
慢慢的，当电脑可以全部算完所有可能性到终局，那是在中局的时候，其实电脑已经赢
了。它那乱无章法的棋，还是可以完美的完成游戏而不犯错误，也是说每一步都是最保
守最好的。可那时候，棋手根本看不到那么多变化，所以每一步都不是最好的，然后到
电脑走的时候，又采取那时棋盘的最佳的那一步走，那就是为什么要到中盘，棋盘上还
是均势，可慢慢的，电脑目数就开始增加。那也是为什么人类根本赢不了电脑。
有一个很好的例子，connect 4。一个4子棋的儿童游戏。其实从第一步开始，双方只有
一种走法，谁走错就输了。大家都没走错就和棋。就是一个很好的例子。和围棋的中盘
一模一样。电脑只要布局不要在能算到的步数内丢目就可以了。

m******u
发帖数: 12400

就是现在赢不了人，终会赢得了的。这没什么可以怀疑的。

u******n
发帖数: 5727

狗很好的说明了一个人干不过一群人，还是老毛说的对人民群众是源泉。。

f*******e
发帖数: 5277

tic tac toe也是存在最优解双方平手吧

s******a
发帖数: 629

人类由于计算能力不足，只能用贪心算法；
Alpha Go计算能力足够，可以用全局优化。

【在 y********n 的大作中提到】

: 我喜爱围棋，在大学也进修过人工智能。之前我觉得谷歌狗不可能赢李。然后在第一局
: 后还觉得李没有把水平发挥出来。看了第二局，我才知道根本没有人可以赢谷歌狗，包
: 括中国任何选手或群体。
: 之前我大大低估了现在电脑组的运算能力，现在才知道当今电脑组运算的恐怖速度。其
: 实布局不是那么重要，电脑只是不沾下风就可以了，它运用以前的棋谱，算出在什么地
: 方下最有可能性，然后才在那里模拟，选出最保守最不臭的一棋。所以布局期间虽然漏
: 洞百出，不过没有马上致命的问题就可以了。因为围棋步数太长，开始的时候电脑也运
: 算不到最后结果，所以只要跟上步伐就可以了。算到时间允许，没有失地就可以了。
: 慢慢的，当电脑可以全部算完所有可能性到终局，那是在中局的时候，其实电脑已经赢
: 了。它那乱无章法的棋，还是可以完美的完成游戏而不犯错误，也是说每一步都是最保

n*******s
发帖数: 17267

只要开局不大差，机器绝对占上风，小李没下好，但程序写好了，人基本上没什么机会
的。

y********n
发帖数: 4452

是啊，可是tic tac toe过于简单，想用一个稍微难点的，分叉多一点的，那就是
connect 4。其实9X9围棋也全解了，所以棋手也玩不过电脑。

【在 f*******e 的大作中提到】

: tic tac toe也是存在最优解双方平手吧

t*******i
发帖数: 4960

所以那天李输了我马上问起alpha go 的硬件配置阿。
现在的计算能力比ibm的深蓝时代强得不知道到哪里去了。
公平竞争，机器一台人一个。
不过机器可以说，你人也可以来一群阿。

s***d
发帖数: 15421

alpha go这个是单机版就是一个48 core的 server 而已连gpu都没上。cluster
version只能能更厉害

★ 发自iPhone App: ChineseWeb 1.0.6

【在 y********n 的大作中提到】

t*******i
发帖数: 4960

https://www.reddit.com/r/baduk/comments/49sqoy/does_anyone_know
hardware_alphago_is/
Economist has an update on the 2nd match, there they state 1920 CPUs and 280
GPUs.

【在 s***d 的大作中提到】

: alpha go这个是单机版就是一个48 core的 server 而已连gpu都没上。cluster
: version只能能更厉害
:
: ★ 发自iPhone App: ChineseWeb 1.0.6

相关主题
● xeon phi就是翔啊	● AMD breaking news tonight after market close
● nvidia: tomorrow the day for fermi?	● 买nvda就是买deep learning
● 阿曼达稳稳地奔翻倍去了	● nvda没有跌的基础
进入Stock版参与讨论

s***d
发帖数: 15421

比赛讲了这次就是单机版不联网。deepmind不可能把data center 搬过去。只带了一
个sever过去。

280
★ 发自iPhone App: ChineseWeb 1.0.6

【在 t*******i 的大作中提到】

: https://www.reddit.com/r/baduk/comments/49sqoy/does_anyone_know
: hardware_alphago_is/
: Economist has an update on the 2nd match, there they state 1920 CPUs and 280
: GPUs.

o*********1
发帖数: 2608

这个是新浪的假新闻吧

【在 s***d 的大作中提到】

: alpha go这个是单机版就是一个48 core的 server 而已连gpu都没上。cluster
: version只能能更厉害
:
: ★ 发自iPhone App: ChineseWeb 1.0.6

t*******i
发帖数: 4960

带网线就行了吧。

s***d
发帖数: 15421

你等半年后看吧半年后保密协议作废。不过估计樊辉都泄密了。阿法狗能让职业初段
三子估计就是拿樊辉实验的。

★ 发自iPhone App: ChineseWeb 1.0.6

【在 o*********1 的大作中提到】

: 这个是新浪的假新闻吧

s***d
发帖数: 15421

都说了不联网防止作弊。

★ 发自iPhone App: ChineseWeb 1.0.6

【在 t*******i 的大作中提到】

: 带网线就行了吧。

t*******i
发帖数: 4960

The distributed version that played Fan Hui ran on 1202 CPUs and 176 GPUs.李
世石不是要一头撞死。

s***d
发帖数: 15421

分布式版本主要是为了学习掌握旗感有了打败职业段位的旗杆计算量可能就不重要
了单机版也足够了樊辉就是耍经验值去的。

★ 发自iPhone App: ChineseWeb 1.0.6
★ 发自iPhone App: ChineseWeb 1.0.6

【在 t*******i 的大作中提到】

: The distributed version that played Fan Hui ran on 1202 CPUs and 176 GPUs.李
: 世石不是要一头撞死。

t*******i
发帖数: 4960

出处please?

t*******i
发帖数: 4960

这个是我的出处。
http://www.economist.com/news/science-and-technology/21694540-w
As Mr Brundage points out, brute force has not been banished entirely from
DeepMind’s approach. Like many deep-learning systems, AlphaGo’s
performance improves, at least up to a point, as more processing power is
thrown at it. The version playing against Mr Lee uses 1,920 standard
processor chips and 280 special ones developed originally to produce
graphics for video games—a particularly demanding task. At least part of
the reason AlphaGo is so far ahead of the competition, says Mr Brundage, is
that it runs on this more potent hardware. He also points out that there are
still one or two hand-crafted features lurking in the code. These give the
machine direct hints about what to do, rather than letting it work things
out for itself. Nevertheless, he says, AlphaGo’s self-taught approach is
much closer to the way people play Go than Deep Blue’s is to the way they
play chess.

p*****d
发帖数: 560

奇怪, 今天Ozil怎么还没过来喷羊百万?
哈哈

相关主题
● Russian murder killing friend over AMD vs Nvidia argument	● NVDA新增长点，NVIDIA Metropolis
● nvda腾讯签约，腾讯的AI用NVDA的GPU.	● AWS开始推出Volta
● NVDA自动驾驶市场有多大？	● 关心AMD应该读读这个thread
进入Stock版参与讨论

s***d
发帖数: 15421

有nda 不会有官方出处都是嘉宾不负责的爆料

★ 发自iPhone App: ChineseWeb 1.0.6

【在 t*******i 的大作中提到】

: 出处please?

s***d
发帖数: 15421

1020 cpu 800 gpu 应该是去年樊辉赢的两场配置那时候还在调试 nda 已经过期。

★ 发自iPhone App: ChineseWeb 1.0.6

【在 t*******i 的大作中提到】

: 出处please?

s***d
发帖数: 15421

有先后手很难平手case 大部分游戏都是先手优势围棋也有所以先手贴目

★ 发自iPhone App: ChineseWeb 1.0.6

【在 f*******e 的大作中提到】

: tic tac toe也是存在最优解双方平手吧

m*****n
发帖数: 2152

真怀疑你真的学过人工智能？
即使学过，也是上个世纪的人工智能吧。
你说的完全就不对。

【在 y********n 的大作中提到】

m*****n
发帖数: 2152

AlphaGo的算法等技术分析
2016-03-10 田渊栋算法与数据结构
来源：知乎专栏-远东轶事
作者：田渊栋（微博@远东轶事）
链接：http://zhuanlan.zhihu.com/yuandong/20607684
作者简介：田渊栋是卡耐基梅隆大学机器人系博士。曾就职于 Google X 部门，目前是
Facebook 的智能围棋 darkforest 的负责人和第一作者。
最近我仔细看了下AlphaGo在《自然》杂志上发表的文章，写一些分析给大家分享。
AlphaGo这个系统主要由几个部分组成：
1、走棋网络（Policy Network），给定当前局面，预测/采样下一步的走棋。/2
2、快速走子（Fast rollout），目标和1一样，但在适当牺牲走棋质量的条件下，速度
要比1快1000倍。
3、估值网络（Value Network），给定当前局面，估计是白胜还是黑胜。
4、蒙特卡罗树搜索（Monte Carlo Tree Search，MCTS)，把以上这三个部分连起来，
形成一个完整的系统。
我们的DarkForest和AlphaGo同样是用4搭建的系统。DarkForest较AlphaGo而言，在训
练时加强了1，而少了2和3，然后以开源软件Pachi的缺省策略 (default policy)部分
替代了2的功能。以下介绍下各部分。
1、走棋网络：
走棋网络把当前局面作为输入，预测/采样下一步的走棋。它的预测不只给出最强的一
手，而是对棋盘上所有可能的下一着给一个分数。棋盘上有361个点，它就给出361个数
，好招的分数比坏招要高。DarkForest在这部分有创新，通过在训练时预测三步而非一
步，提高了策略输出的质量，和他们在使用增强学习进行自我对局后得到的走棋网络（
RL network）的效果相当。当然，他们并没有在最后的系统中使用增强学习后的网络，
而是用了直接通过训练学习到的网络（SL network）,理由是RL network输出的走棋缺
乏变化，对搜索不利。
有意思的是在AlphaGo为了速度上的考虑，只用了宽度为192的网络，而并没有使用最好
的宽度为384的网络（见图2(a))，所以要是GPU更快一点（或者更多一点），AlphaGo肯
定是会变得更强的。
所谓的0.1秒走一步，就是纯粹用这样的网络，下出有最高置信度的合法着法。这种做
法一点也没有做搜索，但是大局观非常强，不会陷入局部战斗中，说它建模了“棋感”
一点也没有错。我们把DarkForest的走棋网络直接放上KGS就有3d的水平，让所有人都
惊叹了下。可以说，这一波围棋AI的突破，主要得益于走棋网络的突破。这个在以前是
不可想像的，以前用的是基于规则，或者基于局部形状再加上简单线性分类器训练的走
子生成法，需要慢慢调参数年，才有进步。
当然，只用走棋网络问题也很多，就我们在DarkForest上看到的来说，会不顾大小无谓
争劫，会无谓脱先，不顾局部死活，对杀出错，等等。有点像高手不经认真思考的随手
棋。因为走棋网络没有价值判断功能，只是凭“直觉”在下棋，只有在加了搜索之后，
电脑才有价值判断的能力。
2、快速走子
那有了走棋网络，为什么还要做快速走子呢？有两个原因，首先走棋网络的运行速度是
比较慢的，AlphaGo说是3毫秒，我们这里也差不多，而快速走子能做到几微秒级别，差
了1000倍。所以在走棋网络没有返回的时候让CPU不闲着先搜索起来是很重要的，等到
网络返回更好的着法后，再更新对应的着法信息。
其次，快速走子可以用来评估盘面。由于天文数字般的可能局面数，围棋的搜索是毫无
希望走到底的，搜索到一定程度就要对现有局面做个估分。在没有估值网络的时候，不
像国象可以通过算棋子的分数来对盘面做比较精确的估值，围棋盘面的估计得要通过模
拟走子来进行，从当前盘面一路走到底，不考虑岔路地算出胜负，然后把胜负值作为当
前盘面价值的一个估计。这里有个需要权衡的地方：在同等时间下，模拟走子的质量高
，单次估值精度高但走子速度慢；模拟走子速度快乃至使用随机走子，虽然单次估值精
度低，但可以多模拟几次算平均值，效果未必不好。所以说，如果有一个质量高又速度
快的走子策略，那对于棋力的提高是非常有帮助的。
为了达到这个目标，神经网络的模型就显得太慢，还是要用传统的局部特征匹配（
local pattern matching）加线性回归（logistic regression）的方法，这办法虽然
不新但非常好使，几乎所有的广告推荐，竞价排名，新闻排序，都是用的它。与更为传
统的基于规则的方案相比，它在吸纳了众多高手对局之后就具备了用梯度下降法自动调
参的能力，所以性能提高起来会更快更省心。AlphaGo用这个办法达到了2微秒的走子速
度和24.2%的走子准确率。24.2%的意思是说它的最好预测和围棋高手的下子有0.242的
概率是重合的，相比之下，走棋网络在GPU上用2毫秒能达到57%的准确率。这里，我们
就看到了走子速度和精度的权衡。
和训练深度学习模型不同，快速走子用到了局部特征匹配，自然需要一些围棋的领域知
识来选择局部特征。对此AlphaGo只提供了局部特征的数目（见Extended Table 4)，而
没有说明特征的具体细节。我最近也实验了他们的办法，达到了25.1%的准确率和4-5微
秒的走子速度，然而全系统整合下来并没有复现他们的水平。我感觉上24.2%并不能完
全概括他们快速走子的棋力，因为只要走错关键的一步，局面判断就完全错误了；而图
2(b)更能体现他们快速走子对盘面形势估计的精确度，要能达到他们图2(b)这样的水准
，比简单地匹配24.2%要做更多的工作，而他们并未在文章中强调这一点。
在AlphaGo有了快速走子之后，不需要走棋网络和估值网络，不借助任何深度学习和GPU
的帮助，不使用增强学习，在单机上就已经达到了3d的水平（见Extended Table 7倒数
第二行)，这是相当厉害的了。任何使用传统方法在单机上达到这个水平的围棋程序，
都需要花费数年的时间。在AlphaGo之前，Aja Huang曾经自己写过非常不错的围棋程序
，在这方面相信是有很多的积累的。
3、估值网络
AlphaGo的估值网络可以说是锦上添花的部分，从Fig 2(b)和Extended Table 7来看，
没有它AlphaGo也不会变得太弱，至少还是会在7d-8d的水平。少了估值网络，等级分少
了480分，但是少了走棋网络，等级分就会少掉800至1000分。特别有意思的是，如果只
用估值网络来评估局面（2177），那其效果还不及只用快速走子（2416），只有将两个
合起来才有更大的提高。我的猜测是，估值网络和快速走子对盘面估计是互补的，在棋
局一开始时，大家下得比较和气，估值网络会比较重要；但在有复杂的死活或是对杀时
，通过快速走子来估计盘面就变得更重要了。考虑到估值网络是整个系统中最难训练的
部分（需要三千万局自我对局），我猜测它是最晚做出来并且最有可能能进一步提高的。
关于估值网络训练数据的生成，值得注意的是文章中的附录小字部分。与走棋网络不同
，每一盘棋只取一个样本来训练以避免过拟合，不然对同一对局而言输入稍有不同而输
出都相同，对训练是非常不利的。这就是为什么需要三千万局，而非三千万个盘面的原
因。对于每局自我对局，取样本是很有讲究的，先用SL network保证走棋的多样性，然
后随机走子，取盘面，然后用更精确的RL network走到底以得到最正确的胜负估计。当
然这样做的效果比用单一网络相比好多少，我不好说。
一个让我吃惊的地方是，他们完全没有做任何局部死活/对杀分析，纯粹是用暴力训练
法训练出一个相当不错的估值网络。这在一定程度上说明深度卷积网络（DCNN）有自动
将问题分解成子问题，并分别解决的能力。
另外，我猜测他们在取训练样本时，判定最终胜负用的是中国规则。所以说三月和李世
石对局的时候也要求用中国规则，不然如果换成别的规则，就需要重新训练估值网络（
虽然我估计结果差距不会太大）。至于为什么一开始就用的中国规则，我的猜测是编程
非常方便（我在写DarkForest的时候也是这样觉得的）。
4、蒙特卡罗树搜索
这部分基本用的是传统方法，没有太多可以评论的，他们用的是带先验的UCT，即先考
虑DCNN认为比较好的着法，然后等到每个着法探索次数多了，选择更相信探索得来的胜
率值。而DarkForest则直接选了DCNN推荐的前3或是前5的着法进行搜索。我初步试验下
来效果差不多，当然他们的办法更灵活些，在允许使用大量搜索次数的情况下，他们的
办法可以找到一些DCNN认为不好但却对局面至关重要的着法。
一个有趣的地方是在每次搜索到叶子节点时，没有立即展开叶子节点，而是等到访问次
数到达一定数目(40)才展开，这样避免产生太多的分支，分散搜索的注意力，也能节省
GPU的宝贵资源，同时在展开时，对叶节点的盘面估值会更准确些。除此之外，他们也
用了一些技巧，以在搜索一开始时，避免多个线程同时搜索一路变化，这部分我们在
DarkForest中也注意到了，并且做了改进。
5、总结
总的来说，这整篇文章是一个系统性的工作，而不是一两个小点有了突破就能达到的胜
利。在成功背后，是作者们，特别是两位第一作者David Silver和Aja Huang，在博士
阶段及毕业以后五年以上的积累，非一朝一夕所能完成的。他们能做出AlphaGo并享有
现在的荣誉，是实至名归的。
从以上分析也可以看出，与之前的围棋系统相比，AlphaGo较少依赖围棋的领域知识，
但还远未达到通用系统的程度。职业棋手可以在看过了寥寥几局之后明白对手的风格并
采取相应策略，一位资深游戏玩家也可以在玩一个新游戏几次后很快上手，但到目前为
止，人工智能系统要达到人类水平，还是需要大量样本的训练的。可以说，没有千年来
众多棋手在围棋上的积累，就没有围棋AI的今天。
在AlphaGo中，增强学习（Reinforcement Learning）所扮演的角色并没有想像中那么
大。在理想情况下，我们希望人工智能系统能在对局中动态地适应环境和对手的招式并
且找到办法反制之，但是在AlphaGo中增强学习更多地是用于提供更多质量更好的样本
，给有监督学习（Supervised Learning）以训练出更好的模型。在这方面增强学习还
有很长的路要走。
另外，据他们的文章所言，AlphaGo整个系统在单机上已具有了职业水平，若是谷歌愿
意开几万台机器和李世石对决（这对它来说再容易不过了，改个参数就行），相信比赛
会非常精彩。
===========================
一些更新。
问题1：“Alphago的MCTS做rollout的时候，除了使用快速走子，还用了搜索树的已有
部分，看起来像是AMAF/RAVE反过来：AMAF是把快速走子的信息传导到树的其它无关部
分，Alphago是把树的其它无关部分拿来增强快速走子。我怀疑这是不是它棋力比其它
DCNN+MCTS强的原因之一。”
这个办法在解死活题的文章中出现过，会在一定程度上提高搜索效率，但是提高多少还
不知道。
问题2：“rollout的走法质量变好可能会导致棋力下降。”
这里要分两种情况，tree policy和default policy。在AlphaGo的文章里面已经说过了
，tree policy的分布不能太尖，不然在搜索时太过重视一些看起来的好着，可能使得
棋力下降。但是除了这种原因，一般来说tree policy变好棋力还是会变强的。
default policy这边，即（半）随机走子到最后然后判分，就很复杂了，质量变好未必
对局面能估得更准。default policy需要保证的是每块棋的死活大体正确，不要把死的
棋下成活的或者反之，而对大局观的要求反而没有那么高。双方完全可以配合着把每块
棋下完，然后转战另一块，而不是说抢在对方前去别处占先手。

y********n
发帖数: 4452

你后面贴的只是细节而已，总体上到中盘每填一子，就少一种可能性。没有多少空格了
，超级电脑一秒可以算多少变化啊。你说的这个改动，围棋软件你说的那些其实都已经
在用了，譬如many face of go就都有用，我好几年前就有玩，你可以读读那些详细介
绍。不过那些日本，美国软件商没有用电脑阵而已。单机可以达到业余一段。

【在 m*****n 的大作中提到】

: 真怀疑你真的学过人工智能？
: 即使学过，也是上个世纪的人工智能吧。
: 你说的完全就不对。

f*******e
发帖数: 5277

tic tac toe真的是无论先后，只要不犯错肯定输不了。

【在 s***d 的大作中提到】

: 有先后手很难平手case 大部分游戏都是先手优势围棋也有所以先手贴目
:
: ★ 发自iPhone App: ChineseWeb 1.0.6

c*********7
发帖数: 19373

game tree,每走一步就会减少很大的运算.

x*******1
发帖数: 28835

跟硬件没啥关系。版上大多数人都不明白alphaGo 厉害在算法。人用的又不是暴力法
。

s***d
发帖数: 15421

alpha go的硬件还比不上ibm deepblue 那个可是超算啊模拟黑洞核弹爆炸。闲的蛋
疼被ibm拿出开show off 死算国象。alpha go 就算是 1020 个cpu 400 gpu还是离超算
差几个数量级的运算。

★ 发自iPhone App: ChineseWeb 1.0.6

【在 x*******1 的大作中提到】

: 跟硬件没啥关系。版上大多数人都不明白alphaGo 厉害在算法。人用的又不是暴力法
: 。

相关主题
● intc要搞gpu	● 大家去围棋班赌google跟李世石的世纪大战吧
● litecoin founder跑路了	● NVDA 增长的一个新问题
● google太牛了，	● 按摩店还是有点盼头的
进入Stock版参与讨论

s***d
发帖数: 15421

查了查原来 tic tax toe最优下法就是平手。。。

★ 发自iPhone App: ChineseWeb 1.0.6

【在 f*******e 的大作中提到】

: tic tac toe真的是无论先后，只要不犯错肯定输不了。

y********n
发帖数: 4452

其实是非常暴力的。

【在 x*******1 的大作中提到】

: 跟硬件没啥关系。版上大多数人都不明白alphaGo 厉害在算法。人用的又不是暴力法
: 。

k*l
发帖数: 2574

这个快速走法是不是相当于人的试走，推演一番，然后评估，觉得不好，可以再推演另
外的变化

w********o
发帖数: 10088

我现在只关心阿发狗和fb的黑森林比谁更牛逼

【在 y********n 的大作中提到】

a*******g
发帖数: 3500

alphago啊

【在 w********o 的大作中提到】

: 我现在只关心阿发狗和fb的黑森林比谁更牛逼

O**l
发帖数: 12923

你们两蠢成这样我都懒得扯
既不懂围棋又不懂AI 悲剧啊
这破帖子也能置顶我早就说了版主智商低得可以

【在 p*****d 的大作中提到】

: 奇怪, 今天Ozil怎么还没过来喷羊百万?
: 哈哈

y********n
发帖数: 4452

是，完全就是这样，而且速度飞快，人根本比不上，就是在时间容许的范围内，把最有
可能的都走一遍，人怎么可以比的了？

【在 k*l 的大作中提到】

: 这个快速走法是不是相当于人的试走，推演一番，然后评估，觉得不好，可以再推演另
: 外的变化

Y****r
发帖数: 3473

interesting

y********n
发帖数: 4452

谢谢你给我们傻瓜们空间聊天，你那么聪明，去和你一样水平的人聊才有意思。不送哈。

【在 O**l 的大作中提到】

: 你们两蠢成这样我都懒得扯
: 既不懂围棋又不懂AI 悲剧啊
: 这破帖子也能置顶我早就说了版主智商低得可以

x****i
发帖数: 729

你的理解都是错的，不要乱想了。让人震惊的不是运算速度，而是alpha狗的选择性
和判断力。什么叫“布局不是那么重要，电脑不落下风就行”，“选出最保守最不臭的
一步”，等等等等？？完全是LZ的臆想，肯定不是那样的。电脑完全处在优势状态，
而大批职业棋手都看不清楚局势，这就是电脑可怕的地方，可以计算到很多步之后的局
面，而且很清晰。

【在 y********n 的大作中提到】

相关主题
● 按摩店还是有点盼头的	● nvidia: tomorrow the day for fermi?
● 两个问题给当代股民浇盆冷水	● 阿曼达稳稳地奔翻倍去了
● xeon phi就是翔啊	● AMD breaking news tonight after market close
进入Stock版参与讨论

h*****7
发帖数: 3192

其实人工智能的可怕之处在于，一旦赢了，基本永远不会输。人类永远不可能翻盘

f*******e
发帖数: 5277

人类可以掀桌子，拔电源

【在 h*****7 的大作中提到】

: 其实人工智能的可怕之处在于，一旦赢了，基本永远不会输。人类永远不可能翻盘

g*****s
发帖数: 1288

说是 AlphaGo的算法分析，夹带一堆Darkforest私货，谁信啊。

【在 m*****n 的大作中提到】

: AlphaGo的算法等技术分析
: 2016-03-10 田渊栋算法与数据结构
: 来源：知乎专栏-远东轶事
: 作者：田渊栋（微博@远东轶事）
: 链接：http://zhuanlan.zhihu.com/yuandong/20607684
: 作者简介：田渊栋是卡耐基梅隆大学机器人系博士。曾就职于 Google X 部门，目前是
: Facebook 的智能围棋 darkforest 的负责人和第一作者。
: 最近我仔细看了下AlphaGo在《自然》杂志上发表的文章，写一些分析给大家分享。
: AlphaGo这个系统主要由几个部分组成：
: 1、走棋网络（Policy Network），给定当前局面，预测/采样下一步的走棋。/2

w********o
发帖数: 10088

不好说啊，关键看互相下几盘，谁学得快

【在 a*******g 的大作中提到】

: alphago啊

t*******i
发帖数: 4960

简直要晕倒。
Have today's desktop PCs surpassed IBM's Deep Blue of 1997?
http://superuser.com/questions/250070/have-todays-desktop-pcs-s

【在 s***d 的大作中提到】

: alpha go的硬件还比不上ibm deepblue 那个可是超算啊模拟黑洞核弹爆炸。闲的蛋
: 疼被ibm拿出开show off 死算国象。alpha go 就算是 1020 个cpu 400 gpu还是离超算
: 差几个数量级的运算。
:
: ★ 发自iPhone App: ChineseWeb 1.0.6

I**********a
发帖数: 1183

打脸别这么狠嘛。。

【在 t*******i 的大作中提到】

: 简直要晕倒。
: Have today's desktop PCs surpassed IBM's Deep Blue of 1997?
: http://superuser.com/questions/250070/have-todays-desktop-pcs-s

t*******i
发帖数: 4960

实在是忍不住。：）
https://news.ycombinator.com/item?id=11251463
edit: some actual estimates. Deep Blue had 11.38 GFLOPS[1]. According to the
paper in Nature, distributed AlphaGo used 1202 CPUs and 176 GPUs. A single
modern GPU can do between 100 and 2000 double precision GFLOPS[2]. So from
GPUs alone AlphaGo had access to 4-5 orders of magnitude more computing
power than Deep Blue did.

【在 I**********a 的大作中提到】

: 打脸别这么狠嘛。。

I**********a
发帖数: 1183

忍不住也该忍啊，人指点江山而来，脸肿的妈都不认识而去，太不（喜）合（闻）适（
乐）了（见）

the
single

【在 t*******i 的大作中提到】

: 实在是忍不住。：）
: https://news.ycombinator.com/item?id=11251463
: edit: some actual estimates. Deep Blue had 11.38 GFLOPS[1]. According to the
: paper in Nature, distributed AlphaGo used 1202 CPUs and 176 GPUs. A single
: modern GPU can do between 100 and 2000 double precision GFLOPS[2]. So from
: GPUs alone AlphaGo had access to 4-5 orders of magnitude more computing
: power than Deep Blue did.

(共1页)

进入Stock版参与讨论

相关主题
● AWS开始推出Volta	● 两个问题给当代股民浇盆冷水
● 关心AMD应该读读这个thread	● xeon phi就是翔啊
● intc要搞gpu	● nvidia: tomorrow the day for fermi?
● litecoin founder跑路了	● 阿曼达稳稳地奔翻倍去了
● google太牛了，	● AMD breaking news tonight after market close
● 大家去围棋班赌google跟李世石的世纪大战吧	● 买nvda就是买deep learning
● NVDA 增长的一个新问题	● nvda没有跌的基础
● 按摩店还是有点盼头的	● Russian murder killing friend over AMD vs Nvidia argument

相关话题的讨论汇总
话题: alphago话题: 走子话题: 走棋话题: 网络话题: 围棋

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

boards

未名新帖统计// 7月16日

历史上的今天