本篇文章923字,读完约2分钟

新闻网(中国青年报新闻网记者张茜) 10月18日在《自然》杂志网站上发表的论文称,迄今为止战胜人类围棋世界冠军的计算机程序alphago的开发团队又出了力。 新计划alphago zero (阿尔法元)不依赖人类的指导和经验,只通过自身的算法加强学习,以100:0的战绩击败了Alphalpha。

“从0开始学,阿尔法元完胜阿尔法狗”

这个消息给社会带来了不小的冲击。 此前被alphago打败的世界知名围棋选手柯洁今天早上在社会交流平台上表示:“纯粹的自我学习的alphago最强……对于alphago的自我进步来说……人类太多了。”

“从0开始学,阿尔法元完胜阿尔法狗”

那么,升级后的alphago zero到底让“长江后浪推前浪”了吗?

人工智能最大的挑战是开发从零开始,能够在超人类水平上学习许多复杂概念的算法。

根据《自然》杂志的公开报道,为了打败人类围棋世界冠军,科学家在训练alphago时使用了监督性学习(数百万人类专业选手的国际象棋步骤)和通过自我游戏的强化学习。 过去的alphago培训过程长达数月,使用了多台机器和48个神经互联网培训所需的专业芯片( tpu )。

“从0开始学,阿尔法元完胜阿尔法狗”

在最近发表的论文中,作者david silver、julian schrittwieser、karen simonyan、demis hassabis等在介绍alphago zero时,学习从零开始,单纯与自己对战。 人类的输入没有超过游戏规则以外的指导、数据、内部知识。

“从0开始学,阿尔法元完胜阿尔法狗”

alphago zero只使用了一张神经互联网。 这个互联网经过训练,专门预测程序本身的招数和局面赢家,每次自我对弈都会进步。 新程序只采用了一台机器和四个tpu。

“从0开始学,阿尔法元完胜阿尔法狗”

在包括近500万局自对游戏在内的几天训练中,——alphago zero可以超越人类,打败所有以前的alphago版本。

david silver团队总结说,企业的deepmind网站本身,alphago zero之所以比alphago强,是因为“不受人类经验的限制,可以自己学习世界上最强的围棋手,也就是既定之外的能力”

“从0开始学,阿尔法元完胜阿尔法狗”

自然杂志也在社会交流平台上表示,随着程序训练的进行,alphago zero独立发现了人类几千年总结的围棋规律,确立了新的战术,给这个古老的游戏带来了新的见解。

“从0开始学,阿尔法元完胜阿尔法狗”

 

标题:“从0开始学,阿尔法元完胜阿尔法狗”

地址:http://www.tjsdzgyxh.com/tyxw/23566.html