由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Programming版 - Deepmind,蜘蛛坦克,小笼包(zz)
相关主题
FPGA-based DNNs[bssd]Golang还不错
DNN就是hype (转载)各位自动驾驶技术发烧友们
问几个神经网络的问题有这回事吗?
大部分人还认为阿法狗在背棋谱 (转载)[bssd] golang貌似要的人很多啊
关于搞ML刷数据的职业前途Sr. Flex Developer
100伪币悬赏:CNN这个东西本质上处理不了形变从Java转到C#,值么? (转载)
transfer learning是不是接近人类学习的本质了?lua优势劣势在哪里
robpike 老流氓DeepMind创始人自述:我们的算法可以横扫一切棋类博弈
相关话题的讨论汇总
话题: 狗狗话题: fb话题: 坦克话题: 小笼包话题: 蜘蛛
进入Programming版参与讨论
1 (共1页)
a*****g
发帖数: 19398
1
http://weibo.com/p/230418713863a50102w408
Deepmind,蜘蛛坦克,小笼包
2016年1月28日 14:39 阅读 97 新浪博客
总觉得要写点什么。
今天的流程是这样的,正常上班,9点一个哈欠坐在电脑前面,发现昨天回家前多删了
一个括号,晚上的script跑错了,修掉一个bug。Reorg在即,无心做新feature。于是
刷手机。这时候微信群黑白子有人说平下赢职业,没链接,光文字,这是出来的第一个
消息,当时大约9点半。不是太相信,马上拿了keywords放狗搜,找到blog,和油管上
Unlisted video,这是第一个链接,放在微信群“计算机围棋”里,炸了。想圈人(主
要是FB的Tian)起床看新闻,感觉不好意思。刘知青老师马上不睡觉看完video,这个
时候有其他中文媒体新闻流出,李喆一转就被删。我去FB发第一篇消息,标题是“WTF
”。然后拉video到末尾看到nature番号,但是nature官网遍寻不到。Video越看越真,
说用了两个DNN,一个做policy,一个做evaluation。Fan Hui的名字出现了。问黑白子
消息来源是不是Aja Huang,消息来源说要保密。这时候FB小田起床了,在群里确认新
闻,说已经看过paper,是self-play产生的三千万盘棋。
插一句,self-play反正我是一直想做的,当然估计也不会是只有我一个。之前的一个
小实验也没收敛所以就放弃了。而且用DNN做局面分析是我之前严肃提议过的。这个时
候第一波感情袭来,bitter-sweet。
然后想到老年棋友ZhiPing,怕老年人不看微信,于是直接一个电话过去,第一句是:
有人把你的《墨绿》做出来了。Zhiping反应过来穿上万精油马甲上微博的时候已经被
别人圈了,说哎呀还是慢了一步。不过后来弈客把他的《墨绿》放在头版头条说来来来
我们看先知,还是倍儿有面子。
这个时候我FB上面7d以上组分成两派,一部分认为Fan Hui臭棋,一部分认为说臭棋的
是臭棋。争论不下。然后正式新闻出来了,狗狗,Nature,果壳,全方位出动。最权威
的Computer-GoList出了一封信标题是“GameOver?”,确认的差不多的时候,AjaHuang
出现了发了一封信说是的是的我们做好了。然后就是一波看棋谱看论文看报道的高潮。
后来的事情大家都知道了。
当天接下来的很长时间里我手机每2分钟响一次。FB,微信,甚至还有Email过来说hi,
看到这个新闻想到你了最近过得怎么样。根本没空一个一个回。
这个时候第二波感情袭来,what now?
狗狗做的事情,self-play,用自己的data来train自己的网络,是我一直提议的方向。
用网络迅速做evaluation function,也是如此。我不做的原因主要有三点,一点是因
为自己要上班,一点是因为没硬件,一点是因为雇不起我的partner们(他们都比我牛
逼太多了)。所以关键是没钱。想到之前朋友送我10块钱彩票没中Powerball,不禁悲
从中来。
所以这个事情就是这样,如果狗狗用了其他我没想到的方法做出来这件事情,我也许会
一边觉得哦原来可以那么做,一边悄悄地不死心地还是把自己的方法再去试一遍。或者
狗狗用了我想到的方法但是没做出来,做了半天还是5/6d,我会彻底放弃然后等天才小
田去研究解空间不平滑的问题。但是现在狗狗用了跟我想法几乎一样的、这么毛糙的土
办法就是这么做出来了,连不甘心都不给人留一份。WHATNOW?
觉得心里很重要的一块东西噗的一记,不见了。
所以谈到这里已经不是谈狗狗了,是谈自己了。你们一个个看了波士顿围棋故事然后说
要自传自传的。这就是自传了。
前几年有一个电影,好像是太极三部曲,不出所料里面有个男小孩暗恋师傅的女儿,表
白失败后他去国外学了机械,很多年后做出一只超大蜘蛛坦克,跑回来反攻师门。其实
我一直想做一个这样的坦克,然后跑回去反攻师门。师门下面反正世界冠军很多,不记
得我一个被劝退的小喽啰。这下被狗狗一搞,坦克做不成了。现在不要说师门了,连整
个武林都处于一种恐慌的境地:怎么易筋经变成在线课程啦?
所以,不要说老纸二十年知识储备都是为了这件project,客气一点讲这是给自己脸上
贴金,不客气一点讲这是三十好几的人还是逃不开这个幼年阴影。看看现在能不能借狗
狗的东风,彻底抛弃这个一直在haunting的鬼魂。扔掉围棋,再重新捡起来。
这大概是第三波感情袭来,哦,前女友也结婚了。
没多久之前在亚马逊丛林走山路,看到太阳从上面照下来,先被高的树挡掉,然后阴影
里长满藤曼,藤曼下是烂掉的枯叶和泥水,蚂蚁从一棵树跑到另一棵树,把这些叶子变
成屎,烂在土里,再长成树,长到顶,长出叶子,去被阳光照着。突然觉得地球无非是
一颗电池。能量从太阳过来,在地球上转换再转换,就这样几十亿年。生命和电池,哪
里还有分别。我们努力进化,进化出一个会吃小笼包的生命形式,以便跟电池区分。告
诉歌者,看,我们的熵低!
所以回到狗狗的棋,章北海说,谁都一样。没有狗狗,会有猫猫,没有小田,会有小申
。这肯定不是智能的第一步,甚至都不是智能的关键一步,这只是智能的平常一步。碳
基低熵体还有很长的路要走,硅基低熵体还刚刚出现,天知道后面是什么。
大概是诗和远方。
好饿。
1/28/2016。@波士顿。
c******n
发帖数: 16666
2
大牛你这个博客是写给自己看得吧
完全意识流
1 (共1页)
进入Programming版参与讨论
相关主题
DeepMind创始人自述:我们的算法可以横扫一切棋类博弈关于搞ML刷数据的职业前途
懂deepmind得说说100伪币悬赏:CNN这个东西本质上处理不了形变
王垠造剑transfer learning是不是接近人类学习的本质了?
老生常谈,请教一个转行问题robpike 老流氓
FPGA-based DNNs[bssd]Golang还不错
DNN就是hype (转载)各位自动驾驶技术发烧友们
问几个神经网络的问题有这回事吗?
大部分人还认为阿法狗在背棋谱 (转载)[bssd] golang貌似要的人很多啊
相关话题的讨论汇总
话题: 狗狗话题: fb话题: 坦克话题: 小笼包话题: 蜘蛛