谷歌DeepMind超进化:国际象棋、围棋吊打世界冠军

  • 时间:
  • 浏览:0

  实在DeepMind的说法令人印象深刻,但当时却未能通过同行评审。不过,DeepMind今天否认,经过数月的反复修订,该公司在AlphaZero上的成果由于被《科学》杂志接受,并登上该杂志的首页。

  新浪科技讯 北京时间12月7日早间消息,Alphabet旗下人工智能部门DeepMind一年前否认开发了一套名为AlphaZero的系统,它还里能 教会本人怎么才能 才能 掌握国际象棋、日本将棋跟生国围棋,某些都能击败世界冠军。

  “几年前,当当让我们 的AlphaGo以4:1击败了18次获得围棋世界冠军的棋手李世石。但对于当当让我们 来说,这实际上是构建一三个 多多通用学习系统的刚结速,你这种 系统还里能 本人学习不同的游戏,最终达到超越人类的水平。“AlphaZero的首席研究员大卫·西尔沃(David Silver)对参加蒙特利尔NeurIPS 2018大会的记者说,“AphaZero是你这种 段旅程的下一步。它从头刚结速学习击败围棋、国际象棋和日本将棋的世界冠军。除了游戏规则外,它你这种 知识都没人 。“

  Silver解释说,选用你这种 游戏既考虑了它们的简化性,也考虑了之前 针对它们进行人工智能研究的充足历史。

  为此,本周发表的论文描述了DeepMind怎么才能 才能 利用角度神经网络实现优于Stockfish、Elmo和IBM深蓝的游戏算法。

  “传统引擎非常强大某些几乎没人 明显的错误,但当面对没人 具体和可计算出理 方案的位置时,由于会居于漂移。”国际象棋大师马修·萨德勒(Matthew Sadler)说,“正是在曾经的位置,AlphaZero还里能实现‘感觉’,‘洞察力’或‘直觉’。 “

  为了测试经过全面训练的AlphaZero,除了其前身AlphaGo Zero之外,DeepMind的研究人员还对上述的Stockfish和Elmo游戏引擎进行了测试。在具有4一三个 多多出理 器内核和一三个 多多谷歌第一代TPU的单台机器上运行时,AlphaZero都能轻松赢得大多数比赛。(樵夫)