4 0 0 - 1 0 0 - 5 6 7 8

探索世界

AlphaGo最强版本登场 可自我提升围棋技艺

  AlphaGo最强版本登场 可自我提升围棋技艺

  【环球网智能综合报道】据英国《每日邮报》10月18日报道,谷歌DeepMind研究人员已经发布了AlphaGo最新版本AlphaGo Zero,可自我学习围棋技艺。这项创新有望解决人类正在面临的一些重要挑战。

   谷歌DeepMind团队在《自然》杂志上公开了AlphaGo Zero。它远胜之前的AlphaGo版本,并且有可能成为史上最强大的围棋高手。

   DeepMind联合创始人兼CEO Demis Hassabis说道: 我们惊喜看到AlphaGo在短短两年取得的成就。目前AlphaGo Zero是最强版本,用更少的计算能力和人类数据的零使用就实现了如此大的进展。

   过去,AlphaGo都要经过成千上万次的人工训练,还要学习专业人员如何下围棋。但是AlphaGo Zero直接跳过这步,它可从任意棋局开始,只需跟自己下棋就可以学习技艺。

   AlphaGo Zero采用强化学习的方式进行自我教导。系统在历史数据空白的神经网络上开始工作,之后利用神经网络和强大的搜索算法跟自己下棋。下棋时,神经网络不断调整更新并预测步骤。更新的神经网络会和搜索算法打造出一个全新的AlphaGo Zero,接下来程序会再次运行。在每次重复中,系统性能和学习质量都有所提升,使得神经网络更为精准,AlphaGo Zero更为强大。

   这项技术之所以比其他版本强大是因为它不再受人工训练水平限制。AlphaGo可在无数棋局后从头学习,而人类棋手要花上千年才能做到。在70小时的自我学习后,AlphaGo Zero就达到超人水平,使用多种布局下棋。短短3天,AlphaGo Zero很快超过了AlphaGo Lee,其曾在2015年以4:1打败韩国著名棋手李在石。

   21天后,AlphaGo Zero达到AlphaGo Master水平。后者今年年初对战数十名中日韩职业围棋选手,取得60胜0负的战绩,并刚刚在5月以3:0完胜19岁中国围棋手柯洁。40天后,AlphaGo Zero超过所有AlphaGo版本,以100:0打败AlphaGo Master。

   研究人员对AlphaGo Zero抱有很多希望。如果相似的技术可以应用到其他结构性问题,例如蛋白折叠、降低能源消耗或寻找革命性新材料,取得的突破将深刻改变社会。Hassabis说道: 我们最终想利用这样的算法突破帮助解决现实生活中的问题,比如蛋白折叠或设计新材料。如果我们可以用AlphaGo Zero在这些问题上取得进展,就有可能改变人类认知并影响我们生活的方方面面。

   谷歌AlphaGo人工智能系统是第一个打败世界围棋冠军的程序,这个神一样的程序足以作为一个标准衡量人工智能的发展。(实习编译:王维 审稿:李宗泽)

今日热点