有了这些能力,电脑会考虑几个动作。对于每一个动作,它都会考虑许多可能的反应,直到它产生一个类似于树的可能的结果模型。目标是通过沿着一条让对手没有好的选择的路径来搜索游戏树中的“最不好的”结果。深蓝也是如此。当然,正如一名厨师所生产的食物取决于食谱的质量一样,基于启发式的人工智能只有人类可以烹饪的启发式才是好的。
但是,当可能性的数量巨大的时候,这种做法还不能胜任。因此,经过几十年的缓慢进展,基于启发式的人工智能只取得了中级业余爱好者的实力。他们是僵化和可预见的对手。记忆和规则遵循不够直观、灵活富有创造力。进一步的进步需要革命。第三阶段:统计随着蒙特卡洛树搜索技术(MCTS)的成功,2006年取得突破性进展。这个方法比较陈旧,今天它被用来加强物流和生产管理。
MCTS已经被应用于车辆路线、航线调度、包装、机器人运动和财务。它已经进入了像“全面战争:罗马II”,“拼字游戏”,“扑克”和“国际象棋”等流行战略游戏。MCTS的名字听起来可怕,但这个想法很简单。它用一个简单的统计技术,即蒙特卡罗模拟来代替人类的启发式算法。当你的财务顾问告诉你,你的投资组合将在你退休的时候生效,那是他们在使用蒙特卡洛模拟。
和以前一样,你从树搜索开始。但是,计算机不是依靠硬编码的Go启发式来估计最佳结果,而是模拟一系列随机游戏,以查看谁更有可能获胜。生成随机数是计算机可以很快做到的事情,而且这是非常有效的。 MCTS削减了中间人的概念,如影响力和aji,提供了一个直接的途径,你最终关心的是:获胜。这就是今天支配AI的哲学:算法不再纯粹是合乎逻辑的。
他们也不模仿人类的思维方式。他们只是理性地追求目标。 (由计算机科学家Stuart Russell和Peter Norvig提出,思想与行为,人为与理性的区别为人工智能的不同方法提供了一个有用的框架。)但MCTS从根本上与人类解决问题的方法不一致。所以基于MCTS的AI显示出奇怪的怪癖。为了真正理解未来有多少自主机器会做出决定,必须了解MCTS的深度陌生性。
与MCTS对手进行比赛可以让他们和一个知道比赛规则的聪明的外星人面对面地坐着,但是双方都从来没有见过真正的比赛。在Go游戏的早期阶段,玩家通常会坚持前四行。 (在角落和侧面比在中心更容易确保领土)。但是使用MCTS的AI程序通常会在中间的某处放置一个棋子。下面是一个例子,从一个真正的游戏中采用了一个相当强大的名为Fuego的AI软件:当然,Fuego的举动是连贯的。
这个棋子扩大了底部的白色棋子的潜力,限制了黑色的潜力,如果稍后受到攻击,白色的两个棋子可能成为生命线。不寻常的举动有三件事。但是,这是奇怪的。在MCTS的AI作品中,这种“做任何事情都可以达到目标”的思维模式,可能会导致麻烦,因为我们希望我们的自驾车、自动专职助手和机器人保姆不仅能胜任,而且可以预测与人类相关的事情。
其次,使用MCTS的人工智能程序可能会出现一个结果。获胜(因此避免风险)MCTS软件往往扮演看似不合理和有害的举动。失去MCTS计划更令人兴奋,他们倾向于壮观的自我毁灭。原因很简单:人类认为我们通过提高我们的领先优势(如果我们赢了)或减少赤字(如果我们输了)来赢得比赛。但是MCTS软件试图提高胜利的可能性。
它不区分5点损失和50点损失。所以,当一个情况是没有希望的时候,MCTS再也不能把好的选项和愚蠢的选项区分开来。在打败的道路上,每条道路看起来同样严峻。随着AI软件的成功几率下降,你会开始一波恐慌浪潮在崩溃中达到高潮。这是一种奇怪的感觉,就像看股票市场的暴跌。如果老的树搜索模型过于僵化,那么MCTS的方法就体现了一个古怪的数字运算专家,没有经验。
有时没有常识的超理性与疯狂是无法区分的。第四阶段:模式识别(2010年至今)研究人员发现了一种在模式识别中根植MCTS的方法,最后的重大突破来临了。当时令人惊讶的关键,竟然是一种受人类大脑启发的旧机器学习技术。人工神经网络是基于20世纪50年代以来的想法。但是他们长期以来一直被认为是机器学习的一个死水。
训练一个神经网络需要大量的数据和大量的计算能力,这是直到最近才能得到的东西。互联网、大数据、分布式计算和云存储等重要技术趋势的融合现在已经改变了这种趋势。神经网络构成了Facebook面部识别和新闻馈送策略技术,Google翻译,自驾车视觉以及无数其他应用程序的支柱。他们特别擅长处理图像和声音。神经网络实际上并不模仿大脑,这是一个常见的误解,类比有助于理解其功能。