首 页 A 重点报道 B 周刊集群 C 本地新闻 品牌活动 电子版
热门搜索关键字: 读我网 鲁商集团 鲁网
读我网 > 周刊 > 周天下 > 正文

在多人德州扑克赛中 AI碾压人类?

2019-7-14 10:32:08 来源:山东商报

        人工智能(AI)领域又出大新闻了!近日,由脸书公司与美国卡内基梅隆大学共同研发的一款名为Pluribus 的人工智能系统,在著名的六人桌德州扑克比赛中战胜了多名世界顶尖高手。相关研究论文已刊登在最新一期《科学》杂志上。


  不得不说,这是继国际象棋、围棋、两人玩德州扑克之后,又一个高难度的人类游戏被 AI 攻陷的里程碑事件。国外多家权威媒体都给予了重头报道。有专家表示,该项研究意义重大,且Pluribus系统背后的人工智能技术在未来应用广泛,它可以在涉及多人和隐藏信息的应用中发挥优势,在无人驾驶、谈判、网络安全,甚至是军事战略等领域都有着重要作用。总之,在未来,人工智能有无限可能!人类,你准备好怎么接招了吗?记者 潘愈


  
  人类完败



  世界扑克顶级高手特雷弗·萨维奇(Trevor Savage)已经玩了15年的专业扑克,在这个过程中,他赢得了数百万美元。平时他的对手只是活生生的人类,而上个月,他则面临着一个令人生畏的新对手——美国卡内基梅隆大学(Carnegie Mel-lon University)和脸书人工智能研究所(Facebook AI Research)的研究人员共同开发的一款强大的人工智能,该团队研发这款机器人的最终目标就是能够击败那些世界顶级扑克玩家。


  美国有线电视新闻网(CNN)商业频道报道称,萨维奇和其他十几个都是男性的职业扑克玩家是在网上远程进行的这项竞赛。在上个月超过12天时间内,他们每天要花费数小时,弓着背趴在电脑屏幕前,尽最大努力打败一个名为Pluribus 的人工智能系统。当然,这些人类选手的付出是有报酬的——根据他们在对抗赛中的表现,他们共同分得了5万美元。


  他们玩的是现下最流行的扑克游戏,不仅限于德州扑克。每场游戏有六个玩家,有时是五个人类玩家共同对抗人工智能Pluribus,有时则是五个版本的人工智能共同对抗一个人类玩家。


  根据脸书人工智能研究公司研究科学家、该项目的共同研发者诺姆·布朗(Noam Brown)的说法,在10000手扑克牌的过程中,人工智能Pluribus系统是一个强有力的、猛烈的竞争对手,最终它在这两种类型的竞赛中都以决定性的压倒优势获胜。



  风险极大



  萨维奇在他位于美国新泽西州西德普特福德的家中办公室内进行的这项比赛,萨维奇本人的表现没有太过抢手,但是他对Pluribus的风格印象深刻。“很明显,人工智能Pluribus从根本上讲是一个健全的、获胜的玩家。”他对CNN说:“人工智能Pluribus系统中混入了大多数顶级高手所采用的那些风险极大的策略。”


  这是人工智能首次在玩家如此之多的扑克游戏中击败人类。布朗认为,人工智能Pluribus系统能为更广泛的问题提供了一个基准,即我们如何让人工智能在复杂的环境中处理那些不完善、不完美的信息,无论这些环境是游戏环境还是现实世界。


  本周四,美国著名杂志《科学》在线发表了对人工智能 Pluribus 系统的相关研究论文。


  多年来,从国际象棋到星际争霸(Starcraft)之类的电子游戏,人工智能一直在击败人类玩家。而一直以来,人工智能通常试图主导双人游戏,其中许多游戏(尤其是国际象棋和围棋)被称为“完全信息”游戏,因为所有玩家都拥有相同数量的信息。


  然而在此次德州扑克比赛中,你不可能知道你对手所知道的所有信息,所以更难预测他们会做出什么样的动作,并且同时与你对战的玩家越多就越困难。这些制约因素使得电脑更难掌控扑克牌游戏规则。



  无所不能



  布朗与美国卡内基梅隆大学的计算机科学教授托马斯·桑德霍尔姆(Tuomas Sandholm)共同研发了人工智能 Pluribus 系统,而Pluribus在拉丁语中意为“许多”。桑德霍尔姆还创办了几家公司,立志将自己在人工智能领域的工作商业化。


  该系统的训练方法是让人工智能与自己的副本对战,刚开始它不知道如何玩游戏,随后会在游戏进行的过程中不断改进。


  此前在2017年,研究人员曾推出一款名为Libratus(在拉丁语中意为“平衡”)的机器人程序,它在宾夕法尼亚州匹兹堡的Rivers赌场持续20天的1对1“无限注德州扑克”(Texas Hold 'Em)比赛中击败了四名顶级玩家,但这也是一款仅局限于两人玩的游戏。


  因此,不言而喻的是,这次Pluribus系统的挑战成功,说明人工智能在游戏领域中又取得了明显的巨大的进步。


  布朗认为,人工智能Pluribus 系统背后的技术最终可以用于涉及多人和隐藏信息的应用,类似那些从欺诈检测到自动驾驶汽车领域,它将是无所不能的。


  美国密西根大学专注于博弈论的教授迈克尔·韦尔曼(Michael Wellman)表示,人工智能Pluribus 系统在对抗人类玩家取得的成功是一件大事。“这是一个令人印象深刻的技术成就。”他还补充说,支撑Pluribus的人工智能技术将来可以用于谈判、网络安全或军事战略等领域。



  更胜一筹



  事实上,桑德霍尔姆名下的一家名为战略机器人(Strategy Robot)的初创公司已经与美国军方签订了价值1000万美元的合同,该公司的目标是为人工智能游戏研发政府应用程序。


  布朗说,人工智能Pluribus系统将不会用于哪个特定的应用。此外,布朗还补充说,他的投资人对这类研究之所以感兴趣,主要是为了推动我们对人工智能的理解。布朗还表示,尽管人工智能Pluribus系统在现实世界中未来的应用还可能只是处于假设阶段,但现在人类可以从它身上学到一些与扑克相关的技巧。例如,在某些情况下,它会比人类倾向下注的金额要高得多,而专业人士指出,在某些情况下,这一举措可能是明智的。


  与传统扑克游戏规则相悖的是,人工智能Pluribus系统更喜欢用“donk betting”策略(指一名玩家在上一轮结束后,以一个叫牌的方式开始下注),而这种玩法似乎要更胜一筹。