首页 > 科技 > 问答 > 科技知识 > 0完胜AlphaGo,alphago利用了哪些特征

0完胜AlphaGo,alphago利用了哪些特征

来源:整理 时间:2022-04-29 02:09:17 编辑:科技知识 手机版

如果给吴老足够多的赛前训练棋熟悉,那我押吴老获胜,起码是过半胜率。如果只是穿越时空把他拉来直接比赛,那我觉得吴老很可能全败,表现比李世石更差,毕竟李世石水平的绝对高度早已超越吴老巅峰时的高度了。AlphaGo Master和AlphaGo Zero其实就不用多说了,吴老胜率应该接近于零。如果给出足够长的时间熟悉和学习,而程序的版本固定不再提高,那么吴老的胜率应该会慢慢提高,下多了之后赢个一两盘不是没可能。

阿尔法元(AlphaGo Zero)为什么能无师自通?

Master版的阿尔法狗,怎么说都应该算是人类的学生,只不过青出于蓝而胜于蓝,现在被“纯自学野路子版”的阿尔法元吊打,的确颇有点让人情何以堪的滋味。要解释为什么阿尔法元(AlphaGo Zero)能无师自通,那答案取决于两个因素:首先是围棋的本质,其次是算法。即围棋这类完全信息博弈并且胜负判断精确且规则明确的问题,在本质上可以不依赖前人的探索,而完全从零开始在足够巧妙的算法和硬件配合下,既能在短时间内到达相当的水平和高度。

这依赖的是首先可以进行自对弈,其次能从自对弈中提取分析胜败的相关因素和特征,并投入到下一轮自对弈中去进行检验。对比一下人类的自学能力所需要的前置条件:首先,得有一个合格的人脑,即一个大约由数百亿神经元组合连接而成的硬件系统,其次得有一个基本的初始输入,包括认字脱盲拥有基础阅读理解能力,这可以类比为人类的算法系统。

在这两者配合之下,至少部分人就拥有了不依赖老师,而自己学习新知识甚至开拓新领域的能力。而AlphaGoZero并非一无所有,它有两大神经网络架构,供它从每一局的自对弈中提取分析胜败的特征算法,即自我反省能力,自我总结能力,并且将这种反省和总结立即投入到下一局的实战中进行校验的能力。而之所以能只通过490万局自对弈就能胜过从前三千万局的成果,我想这主要是因为算法的改进,尤其是特征提取方面的改进造成的,要知道从前的AlpahGo的一些基础特征,比如虎口之类的认知靠的是外界输入设定的,这说明老版本的特征提取能力不强,当然在能够利用人类经验的情况下,许多棋型特征都可以作为先验知识输入,这样在初期显示出来的水平较高,但在后期则可能受制于这些权重较高的经验而误入歧途。

这就是为何阿尔法元的成功,证明了两件事。其一,围棋是可以完全从零开始进行AI化的游戏,其二,人类经验在一定程度上是有局限的,会限制AI在极高水平时候的提高和成长。但我们还是得看到,阿尔法元 vs Master版本时候,并未到达全胜,总还是给人类经验留下点颜面了。另外,看到阿尔法元的成长史,也颇为有趣,万丈高楼也得有个地基啊。

AlphaGo是如何下棋的,它真的能“理解”围棋吗?

【以AlphaGo为例扒一扒人工智能的“思想”】如果你想了解AI的能力,AlphaGo可以是个不错的开始的地方。那么,AlphaGo到底是如何下棋的,它真的能够看透对手的想法,真的理解围棋吗?我们先从围棋开始说起。围棋,就十秒钟围棋的规则很简单。玩家轮流在棋盘上放置白色或黑色的石头。如果一群石头被对手的石头包围,它就被捕获并移除。

用周围的棋子捕捉棋子。像白棋一样包围着大部分区域的其他棋子,就赢了:在比赛之后得分。黑色的左侧,右侧和顶部都有领地。白色的底部和左上角有领土。基本上就是这样。为了理解为什么这样一个简单的游戏几十年来一直困惑人工智能的研究,把围棋与国际象棋对比是有帮助的。几十年来,有人说只要能下棋,计算机就是聪明的。然后,在Alan Turing发表第一个象棋算法半个世纪之后,IBM(NYSE:IBM)Deep Blue超级计算机击败了世界冠军Gary Kasparov。

深蓝的成功令人印象深刻,但是IBM的算法与图灵1950年的计划基本相似。自从图灵(Turing)发表第一个国家象棋算法以来,深蓝(Deep Blue)的计算能力已经增加了三百万倍。一个小小的注意到的事实是:在深蓝击败世界上最伟大的棋手的同一年,最先进的GO只达到了体面的初学者的技术水平。为什么围棋是最好的测试场地?这是一种“不同的思维方式”。

深蓝是以蛮力击败卡斯帕罗夫:因为它记住了大量的游戏,它运用了战术和战略经验法则,并且它比卡斯帕罗夫(尽管几乎没有)使用优越的处理能力可以更深入地预测未来的移动可能性。但是电脑无法掌握灵活的处理能力。国际象棋的可能性受到8×8棋盘和规则的限制,这些规则定义了你可以在哪里移动特定棋子。相比之下,全尺寸的棋盘尺寸为19 x 19,你可以在任何地方使用围棋。

文章TAG:AlphaGoalphago完胜特征利用

最近更新

  • 手机里的图片都在哪里?,你们手机里的照片都存在哪里

    手机空间释放后,上传到腾讯相册不显示占用空间,手机操作过程中也不会出现卡顿现象。清理手机垃圾时,腾讯相册不会有垃圾,所以整体上没有发现内存占用现象。我给大家分享一个储存照片的好方法 ......

    科技知识 日期:2022-07-20

  • 人为什么要有价值观,一个人存在的价值是什么

    树立正确的人生观和积极的价值观,首先要树立正确的是非观。决定一个人价值观的标准不一样。根本区别在于各自的创造力、精力,差异化的社会分工,利益分配平衡中相对统一的需求。一个人的认识和 ......

    科技知识 日期:2022-07-19

  • 为什么黄牛抢票用什么软件,为什么还会有黄牛抢票

    黄牛使用的抢票软件是独立软件。最后黄牛用的抢票软件和我们的差别很大。我们平时用的软件都是市面上常用的。这些抢票软件都是很多人用的,服务器平均分配后自然减少了我们每个人的份额,这也是 ......

    科技知识 日期:2022-07-18

  • 为什么苹果亮银贵,为什么苹果的数据线这么贵

    你知道为什么苹果的数据线贵但是容易断吗?苹果手机最大的优势就是iOS系统和苹果的A系列处理器。关键是最便宜的苹果数据线官方售价149元。按照大部分苹果数据线不到一年的使用寿命,光是 ......

    科技知识 日期:2022-07-18

  • 谷歌眼镜显示屏在哪里,哪些VR眼镜值得买

    VR眼镜的分类目前VR眼镜主要分为VR盒子VR一体机和PCVR。去的太早了,先发明骑行用的智能眼镜还好,但还没消失。第二代企业版谷歌眼镜高通SnapdraonXR1平台运行,不出售 ......

    科技知识 日期:2022-07-18

  • 上海哪里体验一加手机,一加手机真的快不行了吗

    说到一加,总会有一大批人说一加手机只活在互联网上。比如现实中没有一加手机的踪迹。一加定位,首先你必须是网络爱好者,否则一般没机会看到。其次,一加一直以来都是精品旗舰策略,每一次新机 ......

    科技知识 日期:2022-07-17

  • 为什么冬季雾霾最严重怎么办,夏天难道就没有雾霾吗

    为什么冬天有雾霾,夏天没有?看来雾霾的主要原因还是气象条件。其实冬天的雾霾已经比以前轻很多了。所以直到现在,冬天还是有雾霾。个人认为和农民烧麦秸没关系。入秋以来,随着来自中国的西北 ......

    科技知识 日期:2022-07-17

  • 苹果为什么好用,苹果的系统那么难用

    我用的是苹果安卓,我觉得苹果不好用。我承认苹果系统很流畅,但是旗舰安卓机型还可以,更重要的是也很耐用。苹果系统真的没有安卓系统自由。换了苹果第二天就开始想念安卓了,应用很忙。微信视 ......

    科技知识 日期:2022-07-17