a***m 发帖数: 5037 | 1 哈萨比斯:我想补充一点,AlphaGo并没有针对李世乭进行对战训练,我们只是在广泛
层面上训练它。实际上,AlphaGo开始训练的人类对局是网络上强业余棋手之间的对弈
,因此我们的训练资料库中并没有李世乭的对局。然后大家都知道AlphaGo在这之后是
用自我对弈的方式来变得更强。所以我认为信息上双方是对等的,我们并没有用李世乭
的资料来训练它。我再补充一点,即使我们想针对李世乭对AlphaGo进行训练,这也要
求有数以百万的对局可以用来训练。因此几百盘对弈哪怕上千盘也不足以改变AlphaGo
比赛的方式,因为它需要更多的资料。 |
x**w 发帖数: 7947 | 2 看发布会时候,他说我再补充一点之前silver和他耳语几句。估计是告诉他用了李的对
局训练,但李对局公开的一共也就那么几百局,不足以变成针对。 |
D*******r 发帖数: 2323 | 3 什么针对李世石做了针对性的研究和参数调整,那些都是不懂deep learning的人的胡
扯,对于机器学习来讲,几百局,几千局,甚至几万局对其policy和value评估的影响
几乎为零。起码要有上百万上千万的局面影响,才足以对其policy和value评估有改变。
AlphaGo
【在 a***m 的大作中提到】 : 哈萨比斯:我想补充一点,AlphaGo并没有针对李世乭进行对战训练,我们只是在广泛 : 层面上训练它。实际上,AlphaGo开始训练的人类对局是网络上强业余棋手之间的对弈 : ,因此我们的训练资料库中并没有李世乭的对局。然后大家都知道AlphaGo在这之后是 : 用自我对弈的方式来变得更强。所以我认为信息上双方是对等的,我们并没有用李世乭 : 的资料来训练它。我再补充一点,即使我们想针对李世乭对AlphaGo进行训练,这也要 : 求有数以百万的对局可以用来训练。因此几百盘对弈哪怕上千盘也不足以改变AlphaGo : 比赛的方式,因为它需要更多的资料。
|
a***m 发帖数: 5037 | 4 不仅是李。连职业棋手的都没用啊。我看大部分人可不是这么认为的,各种文章都是说
集成了人类历史高手智慧云云。
变。
【在 D*******r 的大作中提到】 : 什么针对李世石做了针对性的研究和参数调整,那些都是不懂deep learning的人的胡 : 扯,对于机器学习来讲,几百局,几千局,甚至几万局对其policy和value评估的影响 : 几乎为零。起码要有上百万上千万的局面影响,才足以对其policy和value评估有改变。 : : AlphaGo
|
b***k 发帖数: 622 | |
n*****t 发帖数: 22014 | 6 大部分左右互搏,我早说了,这种棋谱的价值很低。
【在 b***k 的大作中提到】 : 原来那3000万里面都是网络棋谱?
|
m*******i 发帖数: 75 | 7 不用职业棋手对局进行深度学习是因为即使用了也没有用。因为职业对局数相比于
alpha狗需要训练神经网络的对局数差的太多了。就算录入李世石的棋谱,它也完全没
法改变alpha狗的对局水平。其实将来如果能够对棋谱进行加权学习,应该能提高的更
快。就是重要的高水平的对局能够比次要的低水平的对局更多的影响神经网络的参数,
这样录入李世石的所有棋谱可能会让alpha狗变得更像李世石。
AlphaGo
【在 a***m 的大作中提到】 : 哈萨比斯:我想补充一点,AlphaGo并没有针对李世乭进行对战训练,我们只是在广泛 : 层面上训练它。实际上,AlphaGo开始训练的人类对局是网络上强业余棋手之间的对弈 : ,因此我们的训练资料库中并没有李世乭的对局。然后大家都知道AlphaGo在这之后是 : 用自我对弈的方式来变得更强。所以我认为信息上双方是对等的,我们并没有用李世乭 : 的资料来训练它。我再补充一点,即使我们想针对李世乭对AlphaGo进行训练,这也要 : 求有数以百万的对局可以用来训练。因此几百盘对弈哪怕上千盘也不足以改变AlphaGo : 比赛的方式,因为它需要更多的资料。
|
w****e 发帖数: 586 | 8 有史以来职业选手棋谱有没有100万啊,就算平均每天产生100场,也得连续30年...
【在 b***k 的大作中提到】 : 原来那3000万里面都是网络棋谱?
|
n*****t 发帖数: 22014 | 9 重要比赛对围棋变化的覆盖还是沧海一黍,靠蛮力刷题还是不行
【在 m*******i 的大作中提到】 : 不用职业棋手对局进行深度学习是因为即使用了也没有用。因为职业对局数相比于 : alpha狗需要训练神经网络的对局数差的太多了。就算录入李世石的棋谱,它也完全没 : 法改变alpha狗的对局水平。其实将来如果能够对棋谱进行加权学习,应该能提高的更 : 快。就是重要的高水平的对局能够比次要的低水平的对局更多的影响神经网络的参数, : 这样录入李世石的所有棋谱可能会让alpha狗变得更像李世石。 : : AlphaGo
|
m*******i 发帖数: 75 | 10 其实这才是狗最可怕的地方,也是deepmind开发这个项目的最终目标。就是在再大量原
始低水平数据的基础上通过自我学习,不需要专业的人士的指导,竟然就可以达到甚至
超过人类的顶级水平。这才是AI发展的终极目标吧。
【在 n*****t 的大作中提到】 : 大部分左右互搏,我早说了,这种棋谱的价值很低。
|
|
|
p********e 发帖数: 6030 | 11 deepmind在围棋上已经是妥协了的,一般都是从零开始不需要任何学习资料的。
【在 m*******i 的大作中提到】 : 其实这才是狗最可怕的地方,也是deepmind开发这个项目的最终目标。就是在再大量原 : 始低水平数据的基础上通过自我学习,不需要专业的人士的指导,竟然就可以达到甚至 : 超过人类的顶级水平。这才是AI发展的终极目标吧。
|
t******l 发帖数: 10908 | 12 但可以也应该用职业局作为指导改善三百万低档狗咬狗棋局的质量不是?
更高层的 learning 不是?人类的说法就是 inductive learning 。。。
【在 m*******i 的大作中提到】 : 不用职业棋手对局进行深度学习是因为即使用了也没有用。因为职业对局数相比于 : alpha狗需要训练神经网络的对局数差的太多了。就算录入李世石的棋谱,它也完全没 : 法改变alpha狗的对局水平。其实将来如果能够对棋谱进行加权学习,应该能提高的更 : 快。就是重要的高水平的对局能够比次要的低水平的对局更多的影响神经网络的参数, : 这样录入李世石的所有棋谱可能会让alpha狗变得更像李世石。 : : AlphaGo
|
b*******8 发帖数: 37364 | 13 这明显是扯淡,输了棋嘴硬
有那么多职业的棋谱不训练,去训练业余的,傻子才信!
【在 a***m 的大作中提到】 : 不仅是李。连职业棋手的都没用啊。我看大部分人可不是这么认为的,各种文章都是说 : 集成了人类历史高手智慧云云。 : : 变。
|
i***h 发帖数: 12655 | 14 这又没什么好骗人的
和狗对算法的描述相符合
【在 b*******8 的大作中提到】 : 这明显是扯淡,输了棋嘴硬 : 有那么多职业的棋谱不训练,去训练业余的,傻子才信!
|
b*******8 发帖数: 37364 | 15 职业的棋谱再少,输进去总不会坏吧?没有任何道理不用而只用业余的
【在 i***h 的大作中提到】 : 这又没什么好骗人的 : 和狗对算法的描述相符合
|
O**l 发帖数: 12923 | 16 有些人跟不懂算法
用高手棋谱训练根本没用 而且副作用更大 |
b*******8 发帖数: 37364 | 17 那四楼的怎么解释?
【在 O**l 的大作中提到】 : 有些人跟不懂算法 : 用高手棋谱训练根本没用 而且副作用更大
|
m*****n 发帖数: 3644 | 18 人家最终目的根本就不是围棋。下一步目标是把任何棋局都删掉,直接左右互搏学起。
你还认为专业棋局有意义么?
【在 b*******8 的大作中提到】 : 职业的棋谱再少,输进去总不会坏吧?没有任何道理不用而只用业余的
|
O**l 发帖数: 12923 | 19 四楼说啥了
用职业高手的棋谱就那十几万张 dcnn里面要训练的参数可能都是几十万个有个鸟用
而且bias巨大 绝对over fitting到一个非常糟的一个local optima上了
dcnn的价值就是给出几十可能的走法 根本不需要达到多高的段位
真正走哪个要靠MCT一步上亿次的模拟
【在 b*******8 的大作中提到】 : 那四楼的怎么解释?
|
a*****g 发帖数: 19398 | 20 这是我最关心的研究项目
【在 m*****n 的大作中提到】 : 人家最终目的根本就不是围棋。下一步目标是把任何棋局都删掉,直接左右互搏学起。 : 你还认为专业棋局有意义么?
|
|
|
t******l 发帖数: 10908 | 21 除非有能根据高手的棋谱生成几百万 variation 的 variation 狗。
不过 dcnn 靠 fitting 不靠逻辑,没有 induction 的能力,估计生成
variation 不容易。当然 AI 能做到这样已经不错了。
但问题还是傻子堆里靠数量堆出来的天才,一般都不太稳定,后期成为疯子
的概率比较大。其实人类社会也差不多。
【在 O**l 的大作中提到】 : 四楼说啥了 : 用职业高手的棋谱就那十几万张 dcnn里面要训练的参数可能都是几十万个有个鸟用 : 而且bias巨大 绝对over fitting到一个非常糟的一个local optima上了 : dcnn的价值就是给出几十可能的走法 根本不需要达到多高的段位 : 真正走哪个要靠MCT一步上亿次的模拟
|
z****g 发帖数: 2497 | 22 我严重怀疑零始狗能不能搞出来
两个面瓜闭门造车一万年估计也搞不出啥来,更不用说一些高级战术了。
【在 m*****n 的大作中提到】 : 人家最终目的根本就不是围棋。下一步目标是把任何棋局都删掉,直接左右互搏学起。 : 你还认为专业棋局有意义么?
|
t******l 发帖数: 10908 | 23 我觉得对于围棋,搞出来的可能性还是有那么一点的。
但这个可能比现在业余棋局里傻子堆里拔出来的天才狗更不稳定,搞不好不小心
成为疯狗的概率更大。
【在 z****g 的大作中提到】 : 我严重怀疑零始狗能不能搞出来 : 两个面瓜闭门造车一万年估计也搞不出啥来,更不用说一些高级战术了。
|
O**l 发帖数: 12923 | 24 所谓induction 靠的是MCT
dcnn做的是prediction 给先验分布
【在 t******l 的大作中提到】 : 除非有能根据高手的棋谱生成几百万 variation 的 variation 狗。 : 不过 dcnn 靠 fitting 不靠逻辑,没有 induction 的能力,估计生成 : variation 不容易。当然 AI 能做到这样已经不错了。 : 但问题还是傻子堆里靠数量堆出来的天才,一般都不太稳定,后期成为疯子 : 的概率比较大。其实人类社会也差不多。
|