由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Military版 - 人工智能Libratus是如何击败德州扑克顶级玩家的?
相关主题
打扑克人也不如机器了人工智能有一个项目在我老有生之年是看不见突破了
德州扑克也不是啥人工智能的禁区,早晚碾压人类Re: 李世石是不是对alphago的下棋方法了解太少了 (转载)
AI赌神诞生:德扑人机大战落幕 人工智能完胜生命科学角度看AI
又挖华人上藤校坑,真是无聊AlphaGo的真正可怕之处
弈城惊现疑似谷歌团队ID 金灿佑:棋谱似人工智能zt AlphaGo可能会发现另外一种围棋美,是我们想象不到的 (转载)
人工智能都是扯淡,没有前途,就像三体,人类一个基础认识更新就摧枯拉朽科技部部长万钢回应围棋人机大战 称中国象棋是未来研发方向
李世石感觉状态不行啊这个如果是真的,岂不是扇了某些人的大嘴巴?
阿发狗竟然赢李世石了?完了,我的世界崩溃了!华尔街日报:李世石不适合代表人类出战
相关话题的讨论汇总
话题: ai话题: libratus话题: 扑克话题: 玩家话题: 人类
进入Military版参与讨论
1 (共1页)
B****3
发帖数: 1
1
人工智能Libratus是如何击败德州扑克顶级玩家的?
Libratus是个里程碑,这意味着从华尔街的交易到网络安全乃至于拍卖和政治谈判,这
种AI都可以扮演角色。
编者按: 1 月 30 日,宾夕法尼亚州匹兹堡Rivers赌场,耗时20天的德州扑克人机大
战尘埃落定。卡耐基梅隆大学(CMU)开发的AI程序Libratus 击败人类顶级职业玩家,
赢取了20万美元的奖金。尽管之前Google DeepMind的AlphaGo在与李世石的5番棋围棋
大战以及在网络上跟顶级围棋选手的60番棋大战中出尽了风头。但相对而言德州扑克对
于AI却是更大的挑战,因为AI只能看到游戏的部分信息,游戏并不存在单一的最优下法
。那么CMU的Libratus是如何击败人类顶级的职业玩家的呢?《连线》杂志的这篇文章
为我们揭秘。
在几乎3个星期的时间里,Dong Kim都呆在匹兹堡的一个赌场内跟一台机器玩扑克。但
Kim不是普通的扑克玩家。跟他对垒的也不是普通的机器。而这场比赛也不是普通的扑
克游戏。
28岁的Kim是全世界最好的扑克玩家之一。而那台由卡内基梅隆大学的两位计算机科学
研究人员开发的机器,是一套运行在匹兹堡的一台超级计算机的人工智能系统。在整整
20天的时间内,他们都在玩无限制德州扑克比赛,这是一种尤其复杂的扑克游戏形式,
其投注策略往往要经过很多手。
这场比赛刚刚结束不久。大概赛程过半的时候,Kim开始觉得Libratus好像能看到他的
牌。不过他说:“我不是指责它作弊。而是说它有那么好。”实际上好到击败了Kim及
其他的3名全球顶级人类玩家——这是人工智能的第一次。
在这次比赛期间,Libratus的创造者对这套系统的运作方式显得遮遮掩掩,大家不清楚
它是如何设法取得如此成功的,如何以其他机器前所未有的方式模仿了人类直觉的。但
结果证明,该AI能达到如此高度是因为它不仅仅只是一个AI。
Libratus依靠了3套不同的系统的协作,这提醒我们现代AI并不是由一项而是多项技术
驱动的。这段时间以来深度神经网络抓住了大多人的眼球,当然这也有很好的理由:它
们为一些全球最大型的技术公司从图像识别到翻译乃至于搜索的一切提供了动力。但神
经网络的成功也为大量其他帮助机器模仿甚至超越人类天才的AI技术注入了新生命。
比方说,Libratus就没有使用神经网络。它主要靠的是强化学习,这是人工智能的一种
,一种极其强调试错的方法。其实质就是自己跟自己玩大量的游戏。Google的DeppMind
实验室利用强化学习来开发AlphaGo,这套系统攻克围棋的时间比预期早了10年,但这
两套系统之间有一个关键的不同。AlphaGo是通过分析人类玩家的3000万份棋谱来学习
游戏的,然后才通过自己跟自己下棋来改进自己的技能。相对而言,Libratus却是从零
开始学的。
通过一种名为反事实遗憾最小化(counterfactual regret minimization)的算法,它
先是随机地玩,然后最终在经过几个月的训练以及玩了上万亿手扑克之后,它也达到了
能挑战最好人类玩家的高度,不仅如此,它的玩法还是人类所不能的——它下注的范围
要大得多,而且会对这些赌注随机化,这样对手就更难猜自己手上都有什么牌了。跟导
师Tuomas Sandholm一起开发了这套系统的CMU研究生Noam Brown说:“我们只是向AI描
述了这个游戏,但没有告诉它怎么玩。它完全是独立于人的玩法形成自己的策略的,而
且它的玩法跟人的玩法会非常不一样。”
但这只是第一阶段。在匹兹堡的比赛期间,第二套系统会分析游戏状态并聚焦于第一套
系统的注意力。这套系统属于一种“残局解算器(end-game solver)”,上周一
Sandholm 和Brown发表的论文详细描述了它的细节。在第二套系统的帮助下,第一套系
统再也不需要像过去那样跑完所有可能的场景了。它可以只试探其中的一些场景。也就
是说,Libratus不仅仅是在在比赛前学习,而且还能在比赛中学到东西。
光靠这两套系统就已经很有效率了。但Kim等其他玩家仍然能够找出机器玩法的一些模
式然后设法加以利用。为此,Brown和Sandholm开发了第三套系统。每天晚上Brown都会
跑一个算法来识别出那些模式然后从策略中剔除掉。他说:“一个晚上它就能计算完然
后在次日把一切准备就绪。”
如果这似乎不公平的话,好吧,AI就是这么干。这并不仅仅是AI跨越了许多技术。人类
往往也频繁加入进来,积极地改进AI、跑AI或者增强AI。Libratus的确是个里程碑,展
示了一种新型的AI,从华尔街的交易到网络安全乃至于拍卖和政治谈判,这种AI都可以
从中扮演一定的角色。曾帮助Google设立中心AI实验室,现为百度首席科学家的吴恩达
说:“扑克曾经是AI最难攻克的游戏之一,因为关于游戏状态你只能看到部分信息。扑
克并没有单一的最优下法。相反,AI玩家必须让自己的行动随机化,这样它诈唬时才能
让对方无法确定真假。”
Libratus把这一点做到了极致。它的下注非常的随机化,甚至超过了人类最好玩家的水
平。而且如果这个方法不奏效的话,Brown晚上跑的算法就会弥补它的不足。金融市场
交易员也可以采取相同的做法。外交官亦然。这是一个强大且相当令人不安的想法:机
器可以用大赌注吓退人类。
s***h
发帖数: 487
2
不错,谢谢信息。看来除了神经网路还有 Supercomputer Solver? 的路子。
B****3
发帖数: 1
3
但相对而言德州扑克对于AI却是更大的挑战,因为AI只能看到游戏的部分信息,游戏并
不存在单一的最优下法。
相对于围棋,也许德州扑克更接近人类的活动


: 不错,谢谢信息。看来除了神经网路还有 Supercomputer Solver? 的路子。



【在 s***h 的大作中提到】
: 不错,谢谢信息。看来除了神经网路还有 Supercomputer Solver? 的路子。
s***h
发帖数: 487
4
属实 。。。。。。。。。。


: 但相对而言德州扑克对于AI却是更大的挑战,因为AI只能看到游戏的部分信息,
游戏并

: 不存在单一的最优下法。

: 相对于围棋,也许德州扑克更接近人类的活动



【在 B****3 的大作中提到】
: 但相对而言德州扑克对于AI却是更大的挑战,因为AI只能看到游戏的部分信息,游戏并
: 不存在单一的最优下法。
: 相对于围棋,也许德州扑克更接近人类的活动
:
:
: 不错,谢谢信息。看来除了神经网路还有 Supercomputer Solver? 的路子。
:

x****o
发帖数: 29677
5
德州扑克最简单,首先牌就有限,AI可以大概计算出得牌概率
其次玩了久了学习了人类思维下注的套路,自己下注反过来是随机,玩家一般根据下注
来判断对手的牌就不好使了
B****3
发帖数: 1
6
错了吧,德州只有54张牌,可是54张牌的排列是多少?


: 德州扑克最简单,首先牌就有限,AI可以大概计算出得牌概率

: 其次玩了久了学习了人类思维下注的套路,自己下注反过来是随机,玩家一般根
据下注

: 来判断对手的牌就不好使了



【在 x****o 的大作中提到】
: 德州扑克最简单,首先牌就有限,AI可以大概计算出得牌概率
: 其次玩了久了学习了人类思维下注的套路,自己下注反过来是随机,玩家一般根据下注
: 来判断对手的牌就不好使了

B****3
发帖数: 1
7
52张牌太少?52张牌不同的排列数等于52!
大约等于宇宙诞生至今150亿年中所有的毫秒(千分之一)数。


: 德州扑克最简单,首先牌就有限,AI可以大概计算出得牌概率

: 其次玩了久了学习了人类思维下注的套路,自己下注反过来是随机,玩家一般根
据下注

: 来判断对手的牌就不好使了



【在 x****o 的大作中提到】
: 德州扑克最简单,首先牌就有限,AI可以大概计算出得牌概率
: 其次玩了久了学习了人类思维下注的套路,自己下注反过来是随机,玩家一般根据下注
: 来判断对手的牌就不好使了

1 (共1页)
进入Military版参与讨论
相关主题
华尔街日报:李世石不适合代表人类出战弈城惊现疑似谷歌团队ID 金灿佑:棋谱似人工智能
李世石:我再也不想下这样的比赛了。 (转载)人工智能都是扯淡,没有前途,就像三体,人类一个基础认识更新就摧枯拉朽
百度也要搞无人车 和围棋机器人了李世石感觉状态不行啊
ZT电子科大专家参与研发的“高考机器人”,明年要考一本!阿发狗竟然赢李世石了?完了,我的世界崩溃了!
打扑克人也不如机器了人工智能有一个项目在我老有生之年是看不见突破了
德州扑克也不是啥人工智能的禁区,早晚碾压人类Re: 李世石是不是对alphago的下棋方法了解太少了 (转载)
AI赌神诞生:德扑人机大战落幕 人工智能完胜生命科学角度看AI
又挖华人上藤校坑,真是无聊AlphaGo的真正可怕之处
相关话题的讨论汇总
话题: ai话题: libratus话题: 扑克话题: 玩家话题: 人类