人机大战大跌眼镜，揭秘AlphaGo真相

3月9日下午，谷歌alphago在人机对战的第一盘战胜李世石。虽然李世石赛前曾经表示，人工智能击败人类长期来看将是不可避免的事，但这次他将坚决为捍卫人类尊严而战。但是他还是出现了几个失误，输给了alphago。
2016年1月，国际顶尖期刊《自然》曾经报道了谷歌研究开发的名为alphago的人工智能电脑，这款人工智能于去年10月以5比0完胜欧洲围棋冠军、职业二段樊麾。
当谷歌旗下的deepmind公司宣布邀请韩国著名职业九段棋手李世石五局比赛的时候。大多数人并不看好alphago，包括中国古力，聂卫平和目前第一高手柯杰，很多人都预测alphago会0比5输。而第一局是李世石输了。
虽然，李世石有几个明显失误，但是alphago所表现出来的战斗力远不是1月份的水平，为何高手纷纷走眼?alphago为何表现出比1月份强出若干倍的战斗力呢?这得从alphago是什么说起。
一、alphago牛在哪?
alphago是什么?在今年一月的nature上有alphago的详细介绍，alphago是一套为了围棋优化的设计周密的深度学习引擎，使用了神经网路加上
mcts(montecarlotreesearch)，并且用上了巨大的谷歌云计算资源，使用了gpu的通用计算能力。
alphago
的特点在于充分利用现在的机器学习技术，可扩张的架构，它不仅仅是用一台超级计算机，而是可以利用谷歌庞大的计算资源来做这个深度学习，提升学习能力。谷歌提供了15-20名世界顶级的计算机科学家和机器学习专家和全世界最庞大的谷歌后台计算平台，看看能把围棋这种高难度的人类游戏项目做到什么高度?
围棋是相当感性的项目，它不像象棋每个子都有价值计算，目标明确就是将死对方的王，不被对方将死。围棋的形好坏是相当感性的东西。对优劣的判断也不是纯计算的结果。
而且，围棋的棋盘太大，手数太多，五子棋的复杂度是10的28次幂，国际象棋是10的46次幂，而围棋因为棋盘大，复杂度是10的172次幂。复杂度越高，对计算能力的要求就越高，所以围棋计算机程序的水平一直无法与人类高手相比。
所以，虽然从1997年以来，计算机性能遵照摩尔定律一直在飞速增长，超级计算机每年性能都刷新纪录，但是要挑战围棋这种复杂游戏的人类高手，要到2016年才开始。
alphago虽然有谷歌的庞大计算资源，虽然有gpu通用计算能力。但是它也算不了围棋这种超高复杂度的游戏，不能像简单的棋一样把每一步算清楚。
所以alphago综合了各种人工智能的成果，首先通过深度学习引擎，alphago搞来人类的数千万盘对局，学习人类高手的招数，来选择每一步可能下的几个点。
这个深度学习是可以不断进化的，学习过的越多，选点的水平就越高，而在选择了有限的点之后，就可以用mcts(montecarlotree
search)来算下去了，求出最优解。
当然，围棋的棋盘太大，手数太多，即使是选择有限的点，计算量也无法承受，所以alphago又对棋盘分了区，算局部而整体。
以前结合深度学习和运算能力，配上谷歌庞大的计算资源加以训练(深度学习是可以自己与自己下棋不断提高的)alphago的水平就超越了以前的围棋ai，可以挑战职业棋手了。
二、为何高手会看错
在对局前，从李世石自己到中国高手们，对alphago都是不屑一顾的，因为它们看到的是alphago对樊麾的棋谱，这个棋谱的水平只是赢了，并没有高到那里。所以高手们认为alphago不堪一击。
而事实上，alphago是根据对手的每一步棋在选择，只要赢的概率大，alphago不会像人类一样走追求完美的棋，所以alphago被低估了。
而alphago的深度学习能力是可以不断强化的，人类的棋谱可以输入，机器可以不断的自我对局来积累经验，选择最佳点。求最优解的计算也可以积累。所以alphago的进步实际上是非常非常快的，而且会越来越快。
如同谷歌工程师所说，李世石一年最多下一千盘，而计算机可以一天一百万盘，而且每一盘的经验和计算都可以储存积累。
所以3月份的alphago与1月份的alphago也有了非常大的不同。高手们看到第一盘的棋谱，纷纷认为自己走了眼。中国棋院的一些高手对alphago的认识从职业初段的水平提升到职业五六段，而围棋第一人柯杰的评价更高，他表示自己也只有六成胜算。
alphago以前的棋谱不能代表其极限水平，它是遇强更强的，另外alphago的进步速度也远超人类，所以alphago超越人类高手也许很快就可以做到。
三、人类还有机会吗?
其实，以围棋的复杂程度，现在计算机虽然用上gpu通用计算，用上了分布式计算，依然没有计算清楚围棋所有的变化。
所以，围棋还要深度学习模拟人类选择点，还要用棋盘分区来减轻计算量，在布局和中盘，计算机由于时间和运算能力限制并非能拿出最优解。
因为深度学习选择的点未必是最优的，而靠mcts完全计算清楚再有时间限制的情况下也很困难。
但是到了最后的宫子阶段，计算量大大减少，alphago可以完全算清楚，让每一步都是最优解。人类最多也是与之平手。
所以alphago至少在目前还不是不可战胜，在开局和中盘，人类还是有机会领先的，在宫子阶段可以与之战成平手。实际上1月份二段水平的樊麾也赢了两局快棋。
但是，由于alphago强大的深度学习能力，其深度学习后选择点的能力会越来越高，它也会越来越难战胜。
而今后若干年，随着计算机能力的再扩充，alphago有可能通过mcts把围棋每一步都计算清楚，那个时候围棋这个运动的意义就不大了。
四、alphago的意义
围棋本来认为是无法算清的，至少现在的计算能力不行，而alphago把人类感性的东西，通过计算机庞大的计算能力和高水平的人工智能程序来解释，通过机器的自我学习来提升，这是很有意义的。
alphago里面的深度学习、神经网络、mcts，和alphago的扩张能力计算能力都是通用的技术。alphago今天要进入一个新的应用领域，用alphago的底层技术和alphago的团队，应该可以更快更有效地开发出解决方案。
alphago如果有朝一日在围棋上击败顶级的人类智能，那么这种学习能力用于其他难以精确计算而依靠人类经验判断的领域，也会击败人类。
要知道，现在传感器实际上有远远优于人类的感知能力，如果计算机对非精确描述的事物学习能力也超过人类，那么人类真的就可以被替代了。
无人驾驶是小菜一碟，人类能学会的，计算机都可以学会，而且学得更好，那么人类的所有的技能与经验就全部变成可替代的了，包括编程。计算机可以自我发展，完成各种功能，人类的各种劳动都可以解放了。
计算机具备了深度学习能力以后，人类的所有劳动都可以被替代。工厂是无人的，车辆是无人的，飞机是无人的，饭店服务员是机器人，名厨是一台自动烹调的机器，人类只复杂在机器故障或者失灵时候，做人为的干预与检修。而机器给人创造的财富几乎没有上限，只取决于自然资源的多少。
这个世界听上去似乎很熟悉，没错，天网就在不远的将来。
作者：maomaobear|来源：idonews专栏