哈比斯说没用高手期局训练啊 - Go版

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

Go版 - 哈比斯说没用高手期局训练啊

相关主题
● 阿法狗第二局最令人震惊的地方在于	● 金明完9段点评AlphaGo: 缺点明显
● 李世石吃亏在明处	● 阿法狗生怕人类还不够绝望
● 谷歌推出真正2.0版本AlphaGo 摈弃人类棋谱(图)	● 阿法狗应该如何使用自由时间？
● 关于狗的几个问题	● 田渊栋【facebook 围棋程序负责人】：我怎么看 AlphaGo？
● 金镇浩：李世石将一胜难求	● AlphaGo创始人：下个对手希望是中国柯洁 (转载)
● 接下来的李世石，将是痛不欲生的三局对局	● MCTS是怎么判断形势的
● 兄弟早就说阿发狗是会犯错误的	● 阿法狗怎么做到每天练习几十万盘棋？
● 周志华：关于强化学习策略	● 看来电脑围棋压倒人类就在今年了 (转载)

相关话题的讨论汇总
话题: alphago话题: 训练话题: 对局话题: 棋谱话题: 李世

进入Go版参与讨论

(共1页)

a***m
发帖数: 5037

哈萨比斯：我想补充一点，AlphaGo并没有针对李世乭进行对战训练，我们只是在广泛
层面上训练它。实际上，AlphaGo开始训练的人类对局是网络上强业余棋手之间的对弈
，因此我们的训练资料库中并没有李世乭的对局。然后大家都知道AlphaGo在这之后是
用自我对弈的方式来变得更强。所以我认为信息上双方是对等的，我们并没有用李世乭
的资料来训练它。我再补充一点，即使我们想针对李世乭对AlphaGo进行训练，这也要
求有数以百万的对局可以用来训练。因此几百盘对弈哪怕上千盘也不足以改变AlphaGo
比赛的方式，因为它需要更多的资料。

x**w
发帖数: 7947

看发布会时候，他说我再补充一点之前silver和他耳语几句。估计是告诉他用了李的对
局训练，但李对局公开的一共也就那么几百局，不足以变成针对。

D*******r
发帖数: 2323

什么针对李世石做了针对性的研究和参数调整，那些都是不懂deep learning的人的胡
扯，对于机器学习来讲，几百局，几千局，甚至几万局对其policy和value评估的影响
几乎为零。起码要有上百万上千万的局面影响，才足以对其policy和value评估有改变。

AlphaGo

【在 a***m 的大作中提到】

: 哈萨比斯：我想补充一点，AlphaGo并没有针对李世乭进行对战训练，我们只是在广泛
: 层面上训练它。实际上，AlphaGo开始训练的人类对局是网络上强业余棋手之间的对弈
: ，因此我们的训练资料库中并没有李世乭的对局。然后大家都知道AlphaGo在这之后是
: 用自我对弈的方式来变得更强。所以我认为信息上双方是对等的，我们并没有用李世乭
: 的资料来训练它。我再补充一点，即使我们想针对李世乭对AlphaGo进行训练，这也要
: 求有数以百万的对局可以用来训练。因此几百盘对弈哪怕上千盘也不足以改变AlphaGo
: 比赛的方式，因为它需要更多的资料。

a***m
发帖数: 5037

不仅是李。连职业棋手的都没用啊。我看大部分人可不是这么认为的，各种文章都是说
集成了人类历史高手智慧云云。

变。

【在 D*******r 的大作中提到】

: 什么针对李世石做了针对性的研究和参数调整，那些都是不懂deep learning的人的胡
: 扯，对于机器学习来讲，几百局，几千局，甚至几万局对其policy和value评估的影响
: 几乎为零。起码要有上百万上千万的局面影响，才足以对其policy和value评估有改变。
:
: AlphaGo

b***k
发帖数: 622

原来那3000万里面都是网络棋谱？

n*****t
发帖数: 22014

大部分左右互搏，我早说了，这种棋谱的价值很低。

【在 b***k 的大作中提到】

: 原来那3000万里面都是网络棋谱？

m*******i
发帖数: 75

不用职业棋手对局进行深度学习是因为即使用了也没有用。因为职业对局数相比于
alpha狗需要训练神经网络的对局数差的太多了。就算录入李世石的棋谱，它也完全没
法改变alpha狗的对局水平。其实将来如果能够对棋谱进行加权学习，应该能提高的更
快。就是重要的高水平的对局能够比次要的低水平的对局更多的影响神经网络的参数，
这样录入李世石的所有棋谱可能会让alpha狗变得更像李世石。

AlphaGo

【在 a***m 的大作中提到】

w****e
发帖数: 586

有史以来职业选手棋谱有没有100万啊，就算平均每天产生100场，也得连续30年...

【在 b***k 的大作中提到】

: 原来那3000万里面都是网络棋谱？

n*****t
发帖数: 22014

重要比赛对围棋变化的覆盖还是沧海一黍，靠蛮力刷题还是不行

【在 m*******i 的大作中提到】

: 不用职业棋手对局进行深度学习是因为即使用了也没有用。因为职业对局数相比于
: alpha狗需要训练神经网络的对局数差的太多了。就算录入李世石的棋谱，它也完全没
: 法改变alpha狗的对局水平。其实将来如果能够对棋谱进行加权学习，应该能提高的更
: 快。就是重要的高水平的对局能够比次要的低水平的对局更多的影响神经网络的参数，
: 这样录入李世石的所有棋谱可能会让alpha狗变得更像李世石。
:
: AlphaGo

m*******i
发帖数: 75

其实这才是狗最可怕的地方，也是deepmind开发这个项目的最终目标。就是在再大量原
始低水平数据的基础上通过自我学习，不需要专业的人士的指导，竟然就可以达到甚至
超过人类的顶级水平。这才是AI发展的终极目标吧。

【在 n*****t 的大作中提到】

: 大部分左右互搏，我早说了，这种棋谱的价值很低。

相关主题
● 接下来的李世石，将是痛不欲生的三局对局	● 金明完9段点评AlphaGo: 缺点明显
● 兄弟早就说阿发狗是会犯错误的	● 阿法狗生怕人类还不够绝望
● 周志华：关于强化学习策略	● 阿法狗应该如何使用自由时间？
进入Go版参与讨论

p********e
发帖数: 6030

deepmind在围棋上已经是妥协了的，一般都是从零开始不需要任何学习资料的。

【在 m*******i 的大作中提到】

: 其实这才是狗最可怕的地方，也是deepmind开发这个项目的最终目标。就是在再大量原
: 始低水平数据的基础上通过自我学习，不需要专业的人士的指导，竟然就可以达到甚至
: 超过人类的顶级水平。这才是AI发展的终极目标吧。

t******l
发帖数: 10908

但可以也应该用职业局作为指导改善三百万低档狗咬狗棋局的质量不是？
更高层的 learning 不是？人类的说法就是 inductive learning 。。。

【在 m*******i 的大作中提到】

b*******8
发帖数: 37364

这明显是扯淡，输了棋嘴硬
有那么多职业的棋谱不训练，去训练业余的，傻子才信！

【在 a***m 的大作中提到】

: 不仅是李。连职业棋手的都没用啊。我看大部分人可不是这么认为的，各种文章都是说
: 集成了人类历史高手智慧云云。
:
: 变。

i***h
发帖数: 12655

这又没什么好骗人的
和狗对算法的描述相符合

【在 b*******8 的大作中提到】

: 这明显是扯淡，输了棋嘴硬
: 有那么多职业的棋谱不训练，去训练业余的，傻子才信！

b*******8
发帖数: 37364

职业的棋谱再少，输进去总不会坏吧？没有任何道理不用而只用业余的

【在 i***h 的大作中提到】

: 这又没什么好骗人的
: 和狗对算法的描述相符合

O**l
发帖数: 12923

有些人跟不懂算法
用高手棋谱训练根本没用而且副作用更大

b*******8
发帖数: 37364

那四楼的怎么解释？

【在 O**l 的大作中提到】

: 有些人跟不懂算法
: 用高手棋谱训练根本没用而且副作用更大

m*****n
发帖数: 3644

人家最终目的根本就不是围棋。下一步目标是把任何棋局都删掉，直接左右互搏学起。
你还认为专业棋局有意义么？

【在 b*******8 的大作中提到】

: 职业的棋谱再少，输进去总不会坏吧？没有任何道理不用而只用业余的

O**l
发帖数: 12923

四楼说啥了
用职业高手的棋谱就那十几万张 dcnn里面要训练的参数可能都是几十万个有个鸟用
而且bias巨大绝对over fitting到一个非常糟的一个local optima上了
dcnn的价值就是给出几十可能的走法根本不需要达到多高的段位
真正走哪个要靠MCT一步上亿次的模拟

【在 b*******8 的大作中提到】

: 那四楼的怎么解释？

a*****g
发帖数: 19398

这是我最关心的研究项目

【在 m*****n 的大作中提到】

: 人家最终目的根本就不是围棋。下一步目标是把任何棋局都删掉，直接左右互搏学起。
: 你还认为专业棋局有意义么？

相关主题
● 田渊栋【facebook 围棋程序负责人】：我怎么看 AlphaGo？	● 阿法狗怎么做到每天练习几十万盘棋？
● AlphaGo创始人：下个对手希望是中国柯洁 (转载)	● 看来电脑围棋压倒人类就在今年了 (转载)
● MCTS是怎么判断形势的	● 说古棋是渣的看过来
进入Go版参与讨论

t******l
发帖数: 10908

除非有能根据高手的棋谱生成几百万 variation 的 variation 狗。
不过 dcnn 靠 fitting 不靠逻辑，没有 induction 的能力，估计生成
variation 不容易。当然 AI 能做到这样已经不错了。
但问题还是傻子堆里靠数量堆出来的天才，一般都不太稳定，后期成为疯子
的概率比较大。其实人类社会也差不多。

【在 O**l 的大作中提到】

: 四楼说啥了
: 用职业高手的棋谱就那十几万张 dcnn里面要训练的参数可能都是几十万个有个鸟用
: 而且bias巨大绝对over fitting到一个非常糟的一个local optima上了
: dcnn的价值就是给出几十可能的走法根本不需要达到多高的段位
: 真正走哪个要靠MCT一步上亿次的模拟

z****g
发帖数: 2497

我严重怀疑零始狗能不能搞出来
两个面瓜闭门造车一万年估计也搞不出啥来，更不用说一些高级战术了。

【在 m*****n 的大作中提到】

: 人家最终目的根本就不是围棋。下一步目标是把任何棋局都删掉，直接左右互搏学起。
: 你还认为专业棋局有意义么？

t******l
发帖数: 10908

我觉得对于围棋，搞出来的可能性还是有那么一点的。
但这个可能比现在业余棋局里傻子堆里拔出来的天才狗更不稳定，搞不好不小心
成为疯狗的概率更大。

【在 z****g 的大作中提到】

: 我严重怀疑零始狗能不能搞出来
: 两个面瓜闭门造车一万年估计也搞不出啥来，更不用说一些高级战术了。

O**l
发帖数: 12923

所谓induction 靠的是MCT
dcnn做的是prediction 给先验分布

【在 t******l 的大作中提到】

: 除非有能根据高手的棋谱生成几百万 variation 的 variation 狗。
: 不过 dcnn 靠 fitting 不靠逻辑，没有 induction 的能力，估计生成
: variation 不容易。当然 AI 能做到这样已经不错了。
: 但问题还是傻子堆里靠数量堆出来的天才，一般都不太稳定，后期成为疯子
: 的概率比较大。其实人类社会也差不多。

(共1页)

进入Go版参与讨论

相关主题
● 看来电脑围棋压倒人类就在今年了 (转载)	● 金镇浩：李世石将一胜难求
● 说古棋是渣的看过来	● 接下来的李世石，将是痛不欲生的三局对局
● 加塞不加塞倒是无所谓	● 兄弟早就说阿发狗是会犯错误的
● 李世石表情很痛苦	● 周志华：关于强化学习策略
● 阿法狗第二局最令人震惊的地方在于	● 金明完9段点评AlphaGo: 缺点明显
● 李世石吃亏在明处	● 阿法狗生怕人类还不够绝望
● 谷歌推出真正2.0版本AlphaGo 摈弃人类棋谱(图)	● 阿法狗应该如何使用自由时间？
● 关于狗的几个问题	● 田渊栋【facebook 围棋程序负责人】：我怎么看 AlphaGo？

相关话题的讨论汇总
话题: alphago话题: 训练话题: 对局话题: 棋谱话题: 李世

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

boards

未名新帖统计// 7月16日

历史上的今天