首页  >  新闻热点  >  体育新闻
更强AlphaGo出世!自学三日能超越人类千年

2017-10-19 来源:东方网

 

  AlphaGo

  Deepmind团队最近又放大招了。本周Deepmind在《自然》发表的一篇论文,宣告最新版本的人工智能AI面世,这款新版本叫阿尔法零(AlphaGo Zero)。阿尔法零(AlphaGo Zero)完全不依赖于人类数据,自学三天围棋,对阵阿尔法李世石(AlphaGo Lee)竟然能取得100比0的战绩。围棋世界冠军古力也感叹:“20年不抵3天啊,我们的伤感,人类的进步!”

  AlphaGo四个版本回顾

  AlphaGo最先出现在公众视野,是2015年10月5-0完胜人类的欧洲冠军樊麾二段。樊麾是法国围棋队总教练,他曾多次获得法国冠军,及蝉联2013年至2015年的三届欧洲围棋冠军。两年前,樊麾有幸受邀成为第一位与AlphaGo分先对弈的人类职业棋手。

  2016年3月9日-15日,围棋人机大战在韩国首尔举行,AlphaGo向李世石这样的人类现任顶尖职业棋手发起挑战,AlphaGo最终4-1获胜。

  2016年12月29日晚起到2017年1月4日晚,阿尔法围棋在弈城围棋网和野狐围棋网以“Master”为注册名,依次对战数十位人类顶尖围棋高手,取得60胜0负的辉煌战绩。今年5月23日到27日,在中国乌镇围棋峰会上,阿尔法围棋以3-0的总比分战胜排名世界第一的世界围棋冠军柯洁。

  如今,AlphaGo已经升级到阿尔法零(AlphaGo Zero)版本,这个这个阿尔法从零开始,所以它的名字叫作零(Zero)。阿尔法零与上一个版本阿尔法大师的100番棋战绩为89胜11负,与去年3月和李世石对弈的阿尔法李世石(AlphaGo Lee)的100番棋战绩为100胜0负,而且阿尔法零(AlphaGo Zero)从开始学棋到成为此等高手只用了三天时间。

  阿尔法零颠覆式飞越发展

  阿尔法围棋主要设计者之一大卫-席尔瓦介绍:“人们一般认为机器学习就是关于大数据和海量计算,但阿尔法零的出现让我们意识到算法比所谓计算或数据可用性更重要。”

  据《自然》杂志介绍,AlphaGo的核心是两种不同的深度神经网络:“策略网络”(policy network)和 “值网络”(value network)。它们的任务在于合作“挑选”出那些比较有前途的棋步,抛弃明显的差棋。AlphaGo最初是学习了海量人类棋手棋谱,然后进行大量的自我对弈来进行“深度学习”。

  在阿尔法李世石(AlphaGo Lee)继续取得成功后,AlphaGo之父哈萨比斯就透露,他们的团队正在尝试训练一个没有学习过人类棋谱的人工智能。阿尔法大师采用的策略是,通过数学模型下的自我对局和深度学习,下出真正属于人工智能(AI)的围棋。

  阿尔法李世石(AlphaGo Lee)在去年与李世石对弈时,对李世石下一步棋走哪儿的预测,比现在的阿尔法零精确。阿尔法零现在下的围棋,已经与人类棋手下的围棋完全不在一个档次,它不用老去猜人类棋手想怎么下了。

  三天如何培养一个阿尔法零?

 

  古力、柯洁感叹AlphaGo的强大

  阿尔法零的上一个版本阿尔法大师,在设计之初还需要输入一定的人类思维痕迹的模型。阿尔法零只需要先输入棋盘、棋子,不需要预先输入任何人类数据,仅用到一张神经网络,通过这张网络进行自我训练。李世石版使用了176个GPU和48个TPU,而如今的阿尔法零只使用一台机器和4个TPU。

  从Deepmind公布的信息看,阿尔法零从诞生起到10小时左右,就能发现简单的定式;16小时能发现比较复杂的小雪崩定式。到36小时的时候,阿尔法零就能超越李世石版,发现星位一间夹点角定式。到第55小时,它能发现人类目前暂时理解不到的非人类棋手的定式。到72小时,它就能初步出关,能超越所有人类棋手了。

  当然,阿尔法零与上一个版本阿尔法大师下成89胜11负,还是通过了40天的修炼才做到的。但与人类棋手,需要至少15到20年的学习才有可能成长为顶级棋手来说,阿尔法零的出现确实太惊人了。大卫-席尔瓦也介绍,阿尔法零的表现令他们这些设计者都很震惊。

  世界冠军柯洁感叹:“一个纯净、纯粹自我学习的AlphaGo是最强的,对于AlphaGo的自我进步来讲,人类太多余了。”古力也说:“20年不抵3天啊,我们的伤感,人类的进步!”不过柯洁的感慨可能太过于悲观了。哈萨比斯在今年5月的第二次人机大战后就正式宣布AlphaGo退役。DeepMind继续研究更厉害的AlphaGo版本,目的肯定不是来对付人类棋手,而是在强化学习和改造世界的更广泛领域创造新的途径和方式。

精彩推荐:  

欧冠-皇马憾平 C罗怒吼 霸气庆祝怒怼热刺大将 

NBA各队X因素:韦少恩比德在列伤病成最大变数 

惠若琪走进大学校园率性大笑 

分享到:
责任编辑:紫墨