“从0开始学，阿尔法元完胜阿尔法狗”-太原新闻网

本篇文章923字，读完约2分钟

新闻网(中国青年报新闻网记者张茜) 10月18日在《自然》杂志网站上发表的论文称，迄今为止战胜人类围棋世界冠军的计算机程序alphago的开发团队又出了力。新计划alphago zero (阿尔法元)不依赖人类的指导和经验，只通过自身的算法加强学习，以100:0的战绩击败了Alphalpha。

“从0开始学，阿尔法元完胜阿尔法狗”

这个消息给社会带来了不小的冲击。此前被alphago打败的世界知名围棋选手柯洁今天早上在社会交流平台上表示:“纯粹的自我学习的alphago最强……对于alphago的自我进步来说……人类太多了。”

“从0开始学，阿尔法元完胜阿尔法狗”

那么，升级后的alphago zero到底让“长江后浪推前浪”了吗？

人工智能最大的挑战是开发从零开始，能够在超人类水平上学习许多复杂概念的算法。

根据《自然》杂志的公开报道，为了打败人类围棋世界冠军，科学家在训练alphago时使用了监督性学习(数百万人类专业选手的国际象棋步骤)和通过自我游戏的强化学习。过去的alphago培训过程长达数月，使用了多台机器和48个神经互联网培训所需的专业芯片( tpu )。

“从0开始学，阿尔法元完胜阿尔法狗”

在最近发表的论文中，作者david silver、julian schrittwieser、karen simonyan、demis hassabis等在介绍alphago zero时，学习从零开始，单纯与自己对战。人类的输入没有超过游戏规则以外的指导、数据、内部知识。

“从0开始学，阿尔法元完胜阿尔法狗”

alphago zero只使用了一张神经互联网。这个互联网经过训练，专门预测程序本身的招数和局面赢家，每次自我对弈都会进步。新程序只采用了一台机器和四个tpu。

“从0开始学，阿尔法元完胜阿尔法狗”

在包括近500万局自对游戏在内的几天训练中，——alphago zero可以超越人类，打败所有以前的alphago版本。

david silver团队总结说，企业的deepmind网站本身，alphago zero之所以比alphago强，是因为“不受人类经验的限制，可以自己学习世界上最强的围棋手，也就是既定之外的能力”

“从0开始学，阿尔法元完胜阿尔法狗”

自然杂志也在社会交流平台上表示，随着程序训练的进行，alphago zero独立发现了人类几千年总结的围棋规律，确立了新的战术，给这个古老的游戏带来了新的见解。

“从0开始学，阿尔法元完胜阿尔法狗”

标题：“从0开始学，阿尔法元完胜阿尔法狗”

地址：http://www.tjsdzgyxh.com/tyxw/23566.html

“从0开始学，阿尔法元完胜阿尔法狗”