2017人工智能技术趋势报告

在即将过去的 2017 年,深度学习技术蓬勃发展,alphazero 从「零」开始在多种棋类竞技上快速发展,deepstack 与 libratus 在德州扑克中击败人类高手,gan 衍生出各种变体,语音合成从实验室走向产品,vicarious 提出全新概率生成模型并击破人类的 captcha 验证码。这些令人振奋的进展将智能技术从实验室带到了产业及应用层面,「人工智能」及「深度学习」等概念也进入了大众视野并成为流行词汇。
作为国内首家系统性关注人工智能的科技媒体,机器之心在过去几年的报道工作中见证了深度学习引领的又一次人工智能浪潮以及大众关注的热情,与此同时我们也发现由于「ai effect」的存在,有很多人忽略了深度学习之外的其它人工智能技术,对人工智能各种技术分类及基础概念、技术的历史进程和发展方向都缺乏成体系化的了解,导致对人工智能技术的整体发展趋势及「可用性」缺少宏观认识,并在试图采用人工智能技术进行产业革新时走了很多弯路。
因此,机器之心推出《人工智能技术趋势报告》,旨在帮助读者:
1)系统全面纵览人工智能(ai)的 23 个分支技术。
2)明晰人工智能(ai)下各分支技术的历史发展路径,解读现有瓶颈及未来发展趋势。
3)分析人工智能(ai)下各分支技术在产业中的实际应用情况,评估其在「研究」、「工程」、「应用」、「社会影响」这四个阶段中所处位置,为计划使用人工智能技术的决策者提供决策参考。
4)为 ai 从业者提供技术趋势参考;为产业方、初学者等提供系统性的技术学习资料。
报告节选如下
1.0 引言
1.1 目的
本报告的目的是纵览人工智能(ai)的分支技术,明晰它们的发展路径,从而让读者能够更加准确和全面地了解人工智能研究领域的过去、现在和未来。
1.2 背景
人们很容易混淆人工智能和机器学习(甚至深度学习),觉得它们是一样的。这是一个很大的误解。除了流行的神经网络模型之外,人工智能的历史可以追溯到 1956 年,在达特茅斯那场名为「达特茅斯人工智能夏季研究项目(dartmouth summer research project on artificial intelligence)」的研讨会上,「人工智能(artficial intelligence)」(ai)这一术语被首次提出,人工智能研究领域也就此形成[1]。
本报告所讨论的「人工智能」主要是指可以通过机器体现的智能(也叫做机器智能(machine intelligence))。在学术研究领域,就是指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent) [1]。
一般而言,人工智能的长期目标是实现通用人工智能(agi),这被看作是「强人工智能(strong ai)」。在处理交叉领域问题时,agi 的表现会远远超过普通的机器,并且它还能同时处理多个任务。而弱人工智能(weak ai,也被称为「狭隘人工智能(narrow ai)」)无法解决之前未见过的问题,而且其能力仅局限在特定的领域内。但是,人工智能专家和科学家现在对 agi 的确切定义仍然含混不清。区别强人工智能和弱人工智能的常见方法是进行专业测试,比如咖啡测试、图灵测试、机器人大学生测试和就业测试 [28]。
本报告所讨论的「技术(technology)」是一个广泛的概念,包含了人工智能领域所使用的方法、算法和模型,我们将使用「技术」一词指代这三者。
与人工智能相关的工作可以追溯到 20 世纪 40 年代,那时候 warren mcculloch 和 walter pitts 的研究表明可以通过互连的神经元网络执行计算,donald hebb 也演示了赫布学习(hebbian learning)。1956年,当「人工智能(ai)」这一术语正式成型的时候,相应的研究也开始快速发展。那时候,人工智能还主要被用于问题求解。尽管在 20 世纪 60 年代和 70 年代期间,神经网络缓慢的发展速度和有限的进展受到过批评,但专家系统的出现维持了人们对人工智能的兴趣和相关研究的增长。不久之后,在 20 世纪 80 年代,因为大多数人工智能研究都无法实现它们原先过度的承诺,对人工智能研究的资助也流向了其它领域,由此人工智能学术研究步入了所谓的「人工智能冬天(ai winter)」[1]时期。幸运的是,联结主义者重新发明的反向传播将神经网络带回了舞台。在 20 世纪 90 年代,研究者开始应用概率模型等更科学的方法;与此同时,支持向量机(svm)在很多领域都超过并取代了神经网络。不久之后就进入了崭新的21世纪,大数据的时代到来了,这帮助研究者开发了多种学习算法,使得深度学习在近些年来得到了蓬勃发展。关注人工智能研究的团队越来越多,在专注人工智能的顶级会议(比如 aaai、ijcai、auai 和 ecai)上发表的论文也急剧增长。(专注于那些范围更小的研究主题的会议将在第 3 节进行介绍。)
在第 2 节中,我们将介绍设置的研究方法和标准。在第 3 节中,我们将讨论多种人工智能技术。对于每种人工智能技术,我们都确定了当前所处的发展阶段并进行了详细讨论,并且还简要概述了相应历史或主要事件。此外,我们还将从各种角度分析每种技术的瓶颈和未来。本报告不包含技术细节,但提供了一般性的概述,并希望能根据发展历史确定它们之间的关系。在第 4 节本报告的结尾,我们将讨论人工智能技术的一些影响和局限。
2.0 方法
我们研究的主要方法和信息来源是查阅文献。对于我们覆盖的每种技术,我们都参考了最新的文章、新闻和论文,以帮助确定当前所处的发展阶段。此外,通过研究之前发表的文献,我们也讨论了与特定技术相关的主要事件。
除了定性地查阅文献,我们也使用了一种量化方法来帮助读者理解每种技术的普及程度和成长情况。我们分析了研究者的数量、期刊、出版物、会议、组织、知名奖项授予和对应的资助情况。我们也对适用的案例使用了谷歌趋势工具来大概了解公众对特定技术的认识情况。
2.1 阶段
技术发展阶段的分类学方法有很多,目前常用的是技术生命周期(technology life cycles)方法,其中也包括「衰落」阶段。但是,对于这份针对人工智能技术的研究报告而言,我们没有考虑「衰落」阶段。我们认为尽管一种特定技术的发展可能会在某个时候停滞,但其发展(在科学进步方面看)不会退步;对技术「衰退」的引证通常是在商业角度上考量的。根据我们对 [20][21][22][23] 等多个信息来源的评估和分析,我们确定了人工智能技术发展将会经历的四个周期:研究、工程、应用和社会影响。这里给出了每个阶段的详细定义,以作为未来详细分析的范式:
注:实际上这里涵盖了很多技术的子类别,而我们将它们当作一个整体来确定它们的发展阶段。一旦有特定的迹象说明一种技术已到达特定阶段,那么整个技术类别都将被置于该阶段——尽管对该技术可能还有一些持续性的研究、工程或应用工作。
3.0 人工智能中的技术
根据书籍、论文、博客、视频和 mooc(大型开放式网络课程)等介绍性材料,我们发现 stuart j. russell 和 peter norvig [1] 合著的经典教材《人工智能:一种现代方法》最有帮助。根据这些材料,我们确定了 23 种不同的人工智能技术并将它们分成了 4 大领域:
问题求解(搜索)知识、推理与规划学习通讯、感知与行动
我们根据这23种技术在人工智能领域内的基本机制、方法和应用相似度进行了分类。这些分类并不是互斥的。你可以将它们看作是人类具有的能力,每种能力都有不同的功能,共同协作才能实现更高级更复杂的目标。
3.1 问题求解(搜索)
搜索算法的历史始于 20 世纪 50 年代人工智能的孕育时期,那时候人们关注的重点是问题求解。「搜索(search)」这个术语在人工智能领域内的意思主要是指驱动计算机/智能体的搜索算法,它们可以使计算机以人类的方式求解各种问题。搜索算法一般可以分成两类:无信息(uninformed)搜索和有信息(in-formed)搜索。其中有信息启发式搜索是相当流行的,因为它能根据一些指示快速找到解答。这一类别中包含一种最受欢迎的搜索算法:a*搜索。a*搜索可被定义为是一种(贪婪)最佳优先搜索((greedy) best-first search)。其它的启发式(有信息)搜索算法还包括递归最佳优先搜索(rbfs)、简化有限内存 a*(simplified memory-bounded algorithm/sma*)、蒙特卡洛树搜索(mcts)和束搜索(beam search)。无信息搜索算法包括宽度优先搜索、深度优先搜索、深度限制搜索、双向搜索和迭代深化搜索。启发式搜索算法有一个特定类别是局部搜索算法,其对于约束满足问题(csp)[26]尤其有效。流行的本地搜索算法还包括爬山算法、模拟退火算法、局部束搜索和遗传算法(随机束搜索的变体)。
关于上面提到的约束满足问题(csp),其求解通过满足一组特定约束条件的变量来表示。这是一个在人工智能和运筹学领域都非常热门的研究课题。局部搜索算法可用于解决这类问题,其中使用最小冲突启发式的局部搜索在解决 csp 方面取得了不小的成功。除此之外,相关的技术还包括回溯搜索算法(一种深度优先搜索算法)以及树分解技术。
除了用于传统优化问题的单智能体搜索之外,还有专注于「针对不同一方进行规划」的搜索算法(例如竞争性博弈问题),这种算法被称为对抗搜索算法(adversarial search algorithm)。对抗搜索问题的经典算法包括极小极大(minimax)搜索和 α-β 剪枝。
主要事件:
当前阶段:因为对抗搜索技术已经在游戏博弈领域广泛应用很长时间了,所以用于问题求解的搜索算法的发展阶段被确定为应用阶段。
瓶颈:尽管不同的搜索算法都有应用,但目前搜索算法技术还没有明确直接的商业化解决方案。
未来:随着深度学习的发展,与搜索算法进行整合是很有前景的(比如使用深度强化学习的mcts)。最近,整合了一些对抗搜索元素的生成对抗网络(gan)大受欢迎。可以预见,未来将会有更多智能体出现在更多不同的应用领域。
会议:
遗传与进化计算会议(genetic and evolutionary computation conference/gecco)约束编程原理与实践国际会议(international conference on principles and practice of constraint pro- gramming)
完整版获取:https://h5.youzan/v2/ump/paidcontent/index?kdt_id=1040840&spm=#/columnshow?alias=1yl833jcusvl