当前位置: CNMO > 新闻 > 新闻 > 消息 > 正文

神仙打架?AlphaZero击败棋牌游戏引擎

CNMO 【编译】 作者:许薇,李正浩 李正浩 2018-12-10 13:59
评论(0
分享

  【手机中国新闻】2017,谷歌母公司阿尔法集团旗下的英国人工智能公司DeepMind发布的一项研究——“通过自我模拟让通用强化学习算法掌握国际象棋和日本将棋”占据了各大媒体的头条。

  这项研究描述了一个系统——AlphaZero,它可以教会自己如何玩国际象棋、将棋和围棋。在每种游戏中,AlphaZero都击败了世界冠军,展现出双人完美信息博弈游戏的最先进技巧。完美信息博弈游戏的意思是指,游戏中的任何决定都建立在玩家完全了解过去所有信息的基础之上。

AlphaZero
AlphaZero

  DeepMind今天宣布,经过数月的反复修订,其在AlphaZero上的工作已经被《科学》杂志所接受,并登上了封面。现在AlphaZero已经学会了三种不同的复杂棋类游戏,并且可能学会任何一种完美信息博弈的游戏,这“让我们对创建通用学习系统的使命充满信心”。

  那么AlphaZero有多厉害呢?在国际象棋比赛中,AlphaZero与2016 TCEC冠军Stockfish对弈1000场,只输了6场。此外,它在国际象棋人类常见开局比赛中名列前茅。

人工智能
人工智能

  同时,在日本将棋的比赛中,AlphaZero在与2017年CSA世界冠军Elmo的对弈中,胜率为91.2%。而在对弈前辈AlphaGo Zero的围棋比赛中,它取得了61%的比赛的胜利。也就是说,无论是国际象棋、将棋还是围棋,AlphaZero都击败了当前最厉害的人工智能对手。

  更令人吃惊的是,训练AlphaZero玩这些游戏所花费的时间:学会玩国际象棋用了9个小时,而学会玩日本将棋和围棋分别只用了12个小时和13天!当然,开发这样一个算法的目的可不仅仅是创造超人般的国际象棋程序。能够解决多个复杂问题的单一算法,是创建通用机器学习系统,解决实际问题的重要一步。科学家们的最终目标是利用从中学到的知识,开发出能够应对社会最严峻挑战的系统。

分享

加入收藏

网友评论 0条评论
用其他账号登录:
请稍后,数据加载中...
查看全部0条评论 >
火热围观
潮机范儿

Copyright © 2007 - 北京沃德斯玛特网络科技有限责任公司.All rights reserved 发邮件给我们
京ICP证-070681号 京ICP备09081256号 京公网安备 11010502036320号