1.1 什么是人工智能
通常,我们对人工智能的最初认识更多地来自科幻电影。电影中的AI技术已相当发达,那些机器人拥有与人类几乎相同的外表且具备比人类更强的思维能力,但在现实中,人工智能技术还远未达到这种水平。人工智能技术的形式多种多样,并不拘泥于类人机器人。其应用目前已遍布人们生活的各个方面,甚至包括一些我们很难联想到与之相关联的领域。
1.1.1 改变世界的人工智能
大数据时代的到来以及计算能力的提高为深度学习的发展提供了坚实有力的支撑,深度学习的迅猛发展掀起了人工智能发展的第3次浪潮。随着深度学习在语音识别、自然语言处理和计算机视觉等多个领域中取得成功,许多依赖于人工智能的应用也慢慢发展成熟起来,并逐渐渗透到我们生活的各个方面,例如手机中的智能语音助手,网页广告涉及的智能投放,金融领域的智能投顾系统、智能安防系统,这些都依赖于人工智能。人工智能算法存在于我们的计算机和手机中,存在于企业、政府和学校的服务器中,也存在于公有或私有的云端中。可以预见,未来人工智能将更加快速地渗透到各个行业中,它会与许多传统的生产模式相结合,从而提高生产力;它也会更加深入我们的日常生活,甚至改变我们的生活方式。下面我们一起来了解一下当今活跃于你我之间,正在改变世界的人工智能技术。
1.智能语音助手
智能语音助手是手机上最常见的人工智能技术之一,它的一些基础功能,如推送新闻简讯、语音输入、语音拨号及语音操作等已设计得非常出色。随着人工智能的快速发展,天猫精灵、小爱同学、小度等一系列的新型语音助手相继出现。智能语音助手开始运用于医疗咨询,为患者提供简单的问询服务;它也逐渐应用于汽车领域,让驾驶更便捷、更有趣。
目前智能语音助手所拥有的“智力”还远不及人类,它通常只是根据人们的提问在海量的人类语料库和互联网资料库中寻找最匹配的答案,在一些较复杂的语境或者人类变幻莫测的情感表达中,智能语音助手经常答非所问,牛头不对马嘴。但不可否认,智能语音助手已经逐步展现出与人类的沟通能力。未来,智能语音助手可能会像水、电等一样成为我们生活中的必需品,让我们的生活更加便捷。
2.搜索引擎里的人工智能
使用AI技术的搜索引擎与传统的算法不同。在传统算法中,计算网页排序的模型及模型的参数是由人预先定义的,而在机器学习方向中,模型和参数是在大数据的基础上通过复杂的迭代自主学习得到的。影响排序结果的每个特征的重要程度与如何参与计算都是通过人工智能算法自我学习得到的。自2011年大数据时代的到来以及计算能力的提高,深度学习技术得到广泛且深入的应用,现在的搜索引擎越来越依赖于深度学习技术,搜索结果的准确性和相关性也由此得到大幅度的提升。人们甚至可以通过手绘草图来检索想要的对象。
近年来,AI技术在网页排序、个性化推荐、计算机视觉、语音识别和自然语言理解等领域都取得了长足的进步,当今主流搜索引擎正在从单纯的网页搜索和网页导航工具转变成为世界上最大的个人助理和知识引擎,也就说是AI技术让搜索引擎变得越来越具有智能了。
3.智能驾驶
如今在拥挤的城市里很多人觉得开车麻烦,在通行高峰期呼叫出租车也很困难,乘坐地铁又太拥挤,目前很多城市的交通仍然不是很便利。如果有了无人驾驶技术可能会让我们的出行更便捷。我们只要通过智能手机就能方便快捷地叫来一辆没有司机的智能车,它可以送我们安全抵达目的地。
不仅如此,无人驾驶技术还能为其他很多方面带来巨大变化。例如,在汽车行业,无人驾驶的汽车可能将不再私有化,汽车企业的业务不是销售车辆,而是销售与车辆相关的服务;在金融行业,汽车保险的定义及其产业结构也将可能发生变化。
总的来看,无人驾驶技术是汽车行业与人工智能、高性能计算、物联网等新一代技术深度融合的产物,是当前全球汽车与交通出行领域智能化和网联化发展的主要方向。
4.机器人
工业机器人在很多年前就开始在制造领域发挥作用,在主流的汽车生产线和手机生产线中协助人类完成自动化生产。
在物流领域,机器人也可以发挥很大的作用,谷歌、亚马逊、DHL等公司在几年前就开始尝试使用机器人来完成物流中的“最后一英里”。
服务机器人的出现时间要稍晚于工业机器人,它们直到20世纪90年代才逐渐受到人们的关注。服务机器人按其应用领域可分为个人/家庭服务机器人和专业服务机器人。不过今天的服务机器人还无法像大家想象的那样以真人的外貌形象出现在主人面前。从投资的角度看,机器人的设计追求与人长得一样,仿照人的方式做事不一定有很好的商业前景。原因可能是,机器人越像人类,我们就越容易拿它与真人比较,其技术的不足就暴露无遗,机器人会显得无比愚蠢和笨拙。而真正容易打动用户的很可能是一些功能相对简单、外形更像家电,只面向一两个有限场景的机器人。也就是说,大多数用户可能更喜欢一个具备一定沟通能力、外形比较可爱的小家电,而不是有很多缺陷、笨拙的人形机器人。
1.1.2 了解什么是人工智能
人工智能这个概念存在于我们生活的各个方面,但并不是所有人都能留意到它的存在,许多人只是将它视作一种前沿科技。有的人认为只有长相和人类一样,智能水平至少达到普通成年人的机器才可以称为人工智能;但也有人认为,计算机可以做到人类做不到的事情,比如在一秒钟内完成数百亿次运算,即使再聪明的人类也无法在计算速度上超越计算机,那为什么不能将远超人类的计算机视为人工智能呢?这两种看法哪个更准确呢?为什么我们之前谈到的智能助理、搜索引擎、机器翻译、机器写作、计算机视觉、智能驾驶和机器人等技术可以称为AI技术,而计算机操作系统、财务管理系统和媒体播放器就不属于人工智能的范畴呢?
在人工智能的发展历史上,它的定义也经历了多次改变。一些比较肤浅、不能揭示人工智能内在规律的定义很早就被学者们抛弃了。但直到今天,仍然存在多种关于人工智能的定义,具体使用哪一种定义,这通常取决于当时的语境和关注的焦点。下面我们简要地列举几种在历史上有重大影响的或者是目前仍然流行的定义。
1.人工智能就是让人觉得不可思议的计算机程序
这个定义表示判断一个计算机程序是否具备智能的方法要看这个程序能不能完成一些让人不可思议的事情。这种定义既主观又明显缺乏一致性,它会因为时代、背景及评判者的不同而得到不同的结果。但是这个定义恰恰反映了普通人对人工智能的认识方式和判断标准。每当一个新的AI热点出现时,大众和新闻媒体倾向于用自己的直观经验来判断AI技术的价值高低,但大众对AI技术的难度和价值的直观认识与其实际发展状况存在较大的差异。比如,大众通常认为机器识别图像中的一个物体是一项基础任务而进行复杂运算是比较困难的。但事实上,对于机器来说,准确识别图像中的物体是一项挑战性很高的任务,而进行复杂运算反倒相对简单。
2.人工智能就是与人类思考方式相似的计算机程序
这是一个在人工智能发展的早期非常流行的定义。从本质上来讲,这是一种类似仿生学的直观定义,即用机器来模拟人类的智慧。但是历史经验证明“简单模仿生物”的思路在科学发展中不一定完全可行。一个最著名的例子就是飞机的发明(见图1-1)。在过去几千年的历史中,人类一直梦想着能像鸟类一样扇动翅膀飞上天空,但最后真正让人类能在空中翱翔,打破鸟类飞行速度和高度记录的是与鸟类飞行原理差别较大的固定翼飞机。
图1-1 飞行器中的仿生学
人类是如何思考的?这本身就是一个复杂的技术和哲学问题。哲学家们通过自省和思辨,试图找到人类思维的逻辑法则,而科学家们则通过生物学和心理学实验去了解人类在思考时的身心变化规律。他们都在人工智能的发展历史上起到了极为重要的作用。
一个人的逻辑能力是判断其能否进行理性思考的重要标准之一。从古希腊的先贤们开始,形式逻辑、数理逻辑、语言逻辑和认知逻辑等分支在长期的积累和发展过程中总结出了大量规律性的法则,并成功地为几乎所有科学研究提供了方法论指导。让人工智能遵循逻辑学的基本规律进行运算、归纳和推理是许多早期人工智能学者最大的追求。
世界上第一个专家系统Dendral第一次成功地用人类专家知识和逻辑推理规则解决了一个特定领域的问题。Dendral项目在20世纪60年代取得了瞩目的成功,并衍生出了大量相似的智能程序。但人们也很快发现了基于逻辑学规则和人类知识库来构建人工智能系统的局限性:它只能解决特定的、狭小领域内的问题。因此这种构建方法很难扩展到较宽广的知识领域中,更不能扩展到基于世界知识的日常生活中去。
科学家们也试图从心理学和生物学的角度出发,弄清楚大脑究竟是如何工作的,并希望按照大脑的工作原理来构建计算机程序,从而实现人工智能。然而,这条道路同样艰难,其中最具代表的例子就是神经网络。
早在通用电子计算机出现以前,科学家们就已经提出利用神经元处理信息的假想模型,它与人脑结构十分相似,由数量庞大的神经元共同组成,信息通过若干层神经元的处理后,成为系统的输出信号,并通过它驱动系统的外部器件对环境做出反应。
早期人工神经网络的发展刚起步不久就陷入了低谷,主要有两个原因:一是当时的人工神经网络算法在处理某些特定问题时存在先天的局限,亟待理论上的突破;二是当时计算机的运算能力无法满足人工神经网络的需要。20世纪70—80年代,人工神经网络的理论难题得到解决。从20世纪90年代开始,计算机的计算能力得到飞速提升,人工神经网络重新成为研究的热点。在2010年前后,支持人工神经网络的计算机集群开始得到广泛应用,可供深度学习训练使用的大规模数据集也越来越多。人工神经网络在新一轮人工智能复兴中起到了至关重要的作用。
客观地说,人工神经网络到底能在多大程度上精确地反映人脑的工作方式仍然存在争议。人类至今对大脑如何实现学习、记忆、归纳和推理等思维过程尚缺乏认识,而且我们并不知道,到底应该在哪个层面上(是大脑各功能区相互作用的层面?是细胞之间交换化学物质和电信号的层面?还是分子和原子运动的层面?)利用模拟人脑的结构和运作方式,才能制造出与人类智慧相匹敌的机器。
3.人工智能就是与人类行为相似的计算机程序
与仿生学家强调对人脑的研究和模仿不同,实用主义者并不认为实现人工智能必须要遵循什么模式或理论框架,他们认为能实现目标的方法就是好方法,而不必在意具体使用什么途径。
这种实用主义思想在今天仍然有很强的现实意义。比如,目前的深度学习模型在处理语音识别、机器翻译等与自然语言相关的问题时,基本上都是将输入看成由音素、音节、字或词组成的信号序列,然后将这些信号直接送入深度神经网络进行训练。在深度神经网络内部,每层神经元输出的信号都非常复杂,编程人员通常都不明白这些中间信号的真实含义,但这并不妨碍最终功能的实现。在研究者看来,深度学习模型的工作方式是否与人类相似并不重要,重要的是它能否做得像人类一样好,看起来就好像已经具备人类的能力,比如端到端的人工神经网络将图像直接作为系统的输入,经过中间运算后输出识别结果,我们通常不明白在识别过程中所产生的中间信号的真实含义,但这并不妨碍系统的识别功能。
4.人工智能就是会学习的计算机程序
20世纪80—90年代,研究人员还在统计模型和专家系统之间摇摆不定,机器学习在数据挖掘领域固守阵地。从2000年开始,在短短十几年的时间内机器学习已逐渐展示出了惊人的威力,并首先在计算机视觉领域有了惊人突破。从2012年至今,使用深度学习模型的图像算法在“ImageNet竞赛”中使对象识别和定位的错误率显著降低。2015年,在“ImageNet竞赛”中脱颖而出的领先算法甚至已经超过了人眼的识别准确率。在同一年,语音识别也依靠深度学习获得了大约49%的性能提升。机器翻译与机器写作领域也逐步被深度学习所渗透,其性能也得到了大幅度提升。
“无学习,不AI”,这几乎成了人工智能界的核心指导思想。许多人工智能研究者更愿意称自己为机器学习专家,而不是宽泛的人工智能专家。谷歌公司开发的AlphaGo通过学习大量棋谱,并从大量自我对弈中获得很多经验,从而有了战胜人类对手的基础。很多媒体报道过的AI相关应用都使用了深度学习模型,它们通过自我学习从大量数据资料中获得了经验模型。
本定义同时也符合人类认知的特点:人类的智慧离不开从出生后开始的不间断的学习。今天最典型的AI系统通过大量数据训练得到经验模型的方法也可以看作是模拟人类学习和成长的过程。如果将来人工智能可以达到,甚至超越人类水平,从逻辑上来说机器学习应该是最核心的推动力。人工智能、机器学习和深度学习的关系如图1-2所示。
图1-2 人工智能、机器学习和深度学习的关系
当然,目前最主流的机器学习方法与人类的学习方法仍然存在很大的差别。例如目前的计算机视觉系统需要看过数百万张甚至更多的自行车照片后才能辨认出什么是自行车,但对于人类,即使是一个四五岁的小孩,当他见过一辆自行车后,如果再看到另外一辆哪怕外观完全不同的自行车,他也很可能会辨认出来。人类在学习过程中往往不需要大规模的训练数据。面对纷繁复杂的世界,人类可以用自己卓越的抽象能力,不需要学习大量的案例,就能举一反三,从而归纳出其中的规则、原理甚至思维模式和哲学内涵等。
如果人工智能是一种会学习的机器,那未来它最需要提高的就是像人类一样的抽象和归纳能力。
5.人工智能就是根据对环境的感知做出合理行动并获得最大收益的计算机程序
斯图尔特·罗素(Stuart Russell)与彼得·诺维格(Peter Norvig)在《人工智能:一种现代的方法》一书中对人工智能做出了定义:人工智能是有关“智能主体的研究与设计”的学问,而智能主体是指一个可以观察周遭环境并做出行动以达到目标的系统,如图1-3所示。
图1-3 智能主体的表述
这个定义基本将前4个实用主义的定义都囊括其中,既强调了人工智能根据环境做出主动反应,又强调了人工智能所做出的反应必须达到目标,同时它不再强调人工智能对人类思维方式的模仿。
人工智能不同的定义将人们导向不同的认知和研究方向,不同的理解分别适用于不同的人群和语境。如果将这些定义都综合在一起,得到的定义虽然很全面但会过于笼统而模糊。
以上我们列举了5种常见的人工智能定义。第1种定义揭示了大众看待人工智能的视角,直观易懂,但主观性太强,不利于科学讨论;第2种定义不合理,因为人类对大脑工作的机理认识尚浅,而计算机的运行方法与人脑的工作方法是完全不同的;第3种定义是计算机科学界的主流观点,也是一种从实用主义出发形成的简洁明了的定义,但仍缺乏周密的逻辑;第4种定义主要体现的是机器学习,特别是深度学习流行后AI界的发展趋势,虽不是十分全面但最具时代精神;第5种定义是学术界教科书式的定义,全面均衡且偏重实证。近年来,偏重实证成了人工智能研究者的主流倾向。