他为《智能革命》写了万字笔记,大概get了李彦宏AI思维的全部要义

摘要: 绝对干货| 看懂人工智能,这一篇就够了

10-11 03:10 首页 笔记侠


内容来源:《方军的互联网读书会》,笔记侠经授权发布。

 责编 | Even

第1685篇深度好文:9247字 |12分钟阅读

全网首发·人工智能

笔记君说——


李彦宏等百度高管撰写的心力之作《智能革命》推出几个月来,一直占据科技类图书的潮流榜单,成为许多读者认知了解人工智能的必读书籍,最近还刚刚入选上海书展“解放书单”十大推荐书籍。当然,也因为这本书纵贯历史、科技与人文的庞大格局,以及技术脉络的专业厚重,一般读者要在短时间内消化吸收其中的精华,并不容易。


总有些知识大牛,急读者所急。最近,互联网专家方军,就如庖丁解牛般对《智能革命》进行了细致专业的研读,并且撰写了近万字的读书笔记,可谓一篇读尽全书干货。这还不够,方军也许觉得对很多文字阅读困难的人,一万字的笔记还是很长,还专门制作了上下两期的音频节目,亲身讲解《智能革命》。有这样认真的“读者”,李彦宏知道了估计会很感动。


据悉,8月21日、24日,方军讲解《智能革命》的栏目,将会在喜马拉雅FM专栏“方军的互联网读书会”上线。


让方军老师来读《智能革命》,我们去听方军。


理解人工智能的过程中,我们也讲述了一些人工智能技术的基本原理,因为我们的目标不只是理解人工智能,更重要的是跟着人工智能浪潮,了解原理和内部,有助于我们做出正确的选择。

读《智能革命》,我们主要试图了解五大问题:


  1. 从互联网、到移动互联网、再到人工智能,产业和技术如何演变?

  2. 为什么说,搜索是最大的人工智能项目?

  3. 以无人车为例,我们正面向怎样的人工智能未来?

  4. 如果人工智能是未来的电,对每个企业意味着什么?

  5. 无论个人、企业,还是国家,应该怎样抓住这一变革机遇?


一、从互联网,到移动,到人工智能


《智能革命》开宗明义的第一句话是:你能看见多久的历史,就能看见多远的未来。


谈人工智能的历史,人们会从先驱图灵提出的“图灵测试”说起,或从1956年的达特茅斯会议谈起。在这次会议上,原来叫“计算机模拟”的学科被命名为“人工智能”(Artificial Intelligence,也就是AI)。六十多年来,人工智能经历起步、反思、应用、低迷、稳步、蓬勃,成为一股正在迅速崛起的变革力量,也给了我们太多遐想空间。


▲点击查看大图

当我们把人工智能放在互联网的发展脉络里看,或许可以更清楚。现在所谓的第三波人工智能浪潮,其实也是互联网的延续,简单概括就是:我们从互联网,到移动互联网,然后来到人工智能的时代。


「互联网」


互联网,从1995年左右开始商业化,它最早影响的是可以数字化的领域。


在中国,我们经历了:


  • 1999年左右,新浪、搜狐、网易三大门户兴起;百度搜索引擎兴起;

  • 2003年之后,电子商务高速发展;

  • 2006年左右,所谓Web 2.0的发展,出现了很多社交网站,以新浪微博在2009年的出现为顶点。


当然,这中间还有两个中国特色的领域,一个是网络游戏,它出过首富、盛大陈天桥,现在游戏也是互联网的主要收入来源;一个是依靠QQ起家的腾讯,它成为中国的社交巨头。


通常来说,最能代表中国互联网的是BAT,也就是百度、阿里巴巴和腾讯。


「移动互联网」


在移动互联网时代,BAT继续长大,比如百度有百度地图,阿里的淘宝、天猫和支付宝都已经转移到了移动互联网,腾讯有了所谓的移动互联网的第一张门票——微信。在中国,也出现了模仿苹果的手机硬件公司,其中最成功的,毫无疑问是以互联网的方式做互联网手机的小米。


除了BAT,最能代表中国移动互联网的,可能是另外三个字母的缩写——TMD,T代表今日头条,M代表美团点评,D代表滴滴出行。


过去几年,云计算和大数据也是互联网产业的热门词。不过,相对而言,它们只是幕后的概念,也就是说,它们代表的是一种纯粹的技术或思路,而不是产业。


「人工智能」的时代


人工智能,它既是一种“技术”,又是一种“思路”,更是一种“产业”。


在《智能革命》中,李彦宏有个十分形象的比喻:

从2006年,辛顿发表“深度学习”的关键论文,到2016年,谷歌的AlphaGo打败韩国棋手李世石,在2017年的现在,我们看到,以深度学习为代表的人工智能的幽灵,走出了互联网的身体。


李彦宏在《智能革命》中回忆说:2012年,我注意到深度学习在学术界和应用方面都有了突破。比如,用深度学习的方法来识别图像,突然就比以前的任何算法都有明显提升。这时我马上意识到,新的时代来临了,搜索将被革新。过去我们用文字搜索,现在可以用语音和图像进行搜索。


过去几年,在互联网产业中,人工智能大受关注。


一般来说,人工智能的经典核心应用有三个:

李彦宏讲,触动他的是图像识别。中国现在有两家人工智能独角兽公司,也就是估值超过十亿美元但还没上市的公司,旷视科技和商汤科技。它们的核心技术优势就是“图像识别”,特别是人脸识别。其中旷视科技的核心产品叫Face++,商汤科技的核心产品是人脸识别在安防领域的应用。


语音识别和语音合成领域,中国也有也有一家世界级的公司,它就是科大讯飞。


而在机器翻译领域,全球领先的公司是谷歌和百度。2016年,百度曾在谷歌之前发表采用神经网络翻译论文。现在,谷歌、百度、网易有道翻译所采用的都是所谓“神经网络翻译”。基于深度学习技术的人工智能翻译,已经成为常用的产品。


现在,百度是唯一高调提出“AI优先”的中国互联网巨头,也就是将人工智能作为最核心的战略。从互联网,到移动互联,再到人工智能,这个线索,或许可以帮我们理解百度的战略,理解它为什么这么重视人工智能。百度比其他中国公司更重视和全力投入人工智能,试图在新一波浪潮的开端,重新建立自己的优势。


二、搜索,是最大的人工智能项目


互联网思想家、《失控》作者凯文?凯利(也就是KK),与谷歌创始人拉里?佩奇曾有这样一段对话。


那是在2002年,KK遇到佩奇,他问:“已经有这么多家搜索公司,干嘛还要做免费网络搜索?”佩奇的回答让KK一直难忘,“哦,我们其实在做人工智能。”


到2016年,KK回忆这次问答并预测说:到2026年,谷歌的主营产品将不再是搜索,而是人工智能。


「搜索引擎:人工智能的命运细线」


李彦宏在《智能革命》中将搜索引擎和人工智能的关系,解释得更加清晰。最关键的一条是:搜索引擎的工作逻辑,跟深度学习的逻辑,是相似的。


人工智能浪潮中,很多老词、新词又出现在人们面前,老词比如“专家系统”“人工神经网络”,新词比如“机器学习”“深度学习”。以实用主义的角度看,现在这第三波人工智能浪潮,可以简单看成是基于人工神经网络的深度学习,也就是:人工智能=深度学习。


什么是深度学习?


尝试解读一下。深度学习,其实是对“深层人工神经网络”的重新命名。就像“人工智能”实际上是1956年学者们对“计算机模拟”的重命名。在深度学习中,其中的所谓“深度”是指,采用多层的神经网络来进行模式识别。所谓“学习”是指,通过提供大量数据,训练神经网络的参数,这也叫“训练”,通过这个过程,最终机器掌握了某种知识。


图为CNN网络示例,是深度学习模型中的卷积神经网络


比如那个著名的“让计算机认识猫”的案例:输入大量的Youtube图像,让神经网络学会,以后看到类似这样的图像,就是猫。它学会之后,当我们输入想让它理解的数据时,比如输入一张图片,它就能告诉我们,这是不是猫。


深度学习可以分为三大类:监督学习,无监督学习,和强化学习


监督学习,相当于有老师判断作业做对了还是做错了,而我们就是帮机器这个学生做判断的老师;


无监督学习,相当于没有老师判断,我们要自己摸索学会。机器识别猫,为什么说它是突破性的,就是因为它是无监督学习,没有人告诉机器“你学会了”;


强化学习,则是让机器自己去路上走,要面对各种突发情况,根据环境的反馈作出调整。战胜人类围棋选手的AlphaGo,就是强化学习的代表,它可以自己跟自己下棋,让自己对外部环境作出反应,反复训练,从而掌握新的知识。


这番解释,其实是想说,现在热门的“深度学习”,它的工作原理是:我们输入大量数据给计算机,把我们要的结果也给计算机,然后机器通过大量数据进行训练,自己找到“从输入到输出”的公式,也就是机器学会了某种知识。


这也是为了理解,为什么搜索引擎和深度学习是一种逻辑?



先想一想,我们平时是怎么用百度的:在搜索框里输入一个关键词,点击查询,很快,就能得到一系列相关结果网页。现在换个角度想想,搜索引擎的工作方式是什么:


首先,它要“倾听”用户的需求,也就是思考搜索框里的关键词,了解我们究竟是想要什么;


其次,它要在海量的内容中进行“检索”,然后挑选出最符合要求的那些结果提供给用户。


关键在于它给我们挑选出的结果到底是好是坏?刻,我们的对结果的点击就是一种“回答”。如果我们没有点击排在前面的结果,而去点击第二页的结果,这就表示,我们对它给的结果不满意,也就是对系统的推荐做出了降权举动。次数多了之后,它就懂了,就会将点击次数最多的结果排在最前面。


在这个过程中,搜索引擎不仅提高了推荐的准确性,还越来越懂得判断所收录网页的“好”与“坏”,渐渐学会了像人类一样去分辨网页。


在《智能革命》这本书中,李彦宏提到:搜索是最大的人工智能项目。搜索引擎是播种机、实验场和数字对撞机,结合语音识别、图像识别和机器翻译,通过大量用户的实际使用又采集回来更多有价值的数据,反过来帮助神经网络优化训练效果,形成一个良性的发展闭环。


我们还可以从软件工程师的角度看,搜索引擎开发流程的核心原理,也和人工智能一脉相承。用专业的话说就是,两者有一样的基因,都是“以数据为主,通过抽取其中的特征、模式,然后用这个模式给用户带来价值。”


比如,对百度这样的搜索引擎,它的开发流程有四步:

现在,很多公司都在考虑进行人工智能系统的开发,但是,除了机器翻译、语音识别、图像识别等少数领域,我们可找到的参照物有限。而如果具体地把人工智能系统和搜索引擎对照起来看,有了一个已经存在的、大家都比较熟悉的参照物,我们就可以更形象、更清晰地思考。


我们也可以看到,网络地图服务等等,其实也都有相似的逻辑 。


《智能革命》这本书甚至认为,这种模式可能是一直以来人类进步的方式。书中说,人类进步的方式包括三个关键步骤:


第一,人类捕捉宇宙中的各种现象,特别是通过有意识的观察,获得经验;

第二,通过计算,将信息有效地组织、处理、提炼,使人类对某个现象进行更深入和抽象的理解,形成知识;

第三,人类利用产生的知识认知来采取行动,与现象交互,最终实现我们预期的结果。


简单说,这三步就是:观察现象,发现规律,应用知识。


我们要设想人工智能的未来,设想它的应用场景。而现在最大的人工智能项目就是搜索引擎,它的工作机理、开发方式,都是人工智能的方式。我们对它的原理研究越深入,越可能找到怎么应用人工智能的方式。


三、以无人车为例,我们将迎来怎样的人工智能未来?


我们要关注无人车,有一个重要原因:从无人车的发展历程中,我们可能看到人工智能的未来——越来越智能的“云端”。所有的智能机器人、智能设备,都是在这个核心逻辑下发展出来的。


可以说,无人车或自动驾驶,是人工智能集大成的应用场景。谷歌和百度都全力投入无人车。知名投资人李开复也称,自动驾驶,是AI最大的应用场景。当然,现在大家普遍认为,这个领域应该还需要十年以上才会成熟。


「历史」


我们简单看看无人车的历史,看看无人驾驶汽车,怎么从遥控,到轨道,到导航,再到云端的。


1925年8月,人类第一辆无人驾驶汽车正式亮相,车名叫“美国奇迹”(American Wonder)。这辆车驾驶座上没有人,它在纽约大街上,从百老汇一直开到第五大道。不过,这其实是一辆遥控汽车,在后面一辆车上,工程师弗朗西斯· P.霍迪尼(Francis P. Houdina)靠发射无线电波操控前面这辆车。


1940年,设计师诺曼·贝尔·格迪斯(Norman Bel Geddes)提出了无人驾驶的概念。在他的《神奇的高速公路》一书中,他提到:高速公路应该配有类似火车轨的东西,为汽车提供自动驾驶系统。汽车开上高速后就会按照一定的轨迹和程序行进,驶出高速后再恢复到人类驾驶。


  通用汽车第二代Firebird概念车


1956年,通用汽车造出了无人车火鸟二代概念车(Firebird II)。它的思路跟过去是相似的,根据埋在路下面的电缆发出的信号来行使。不管是最初遥控,还是地面铺设轨道,都是让人来要操纵汽车,只不过人不是坐在驾驶座上而已。


1977年,日本的筑波实验室,开发出了新一代自动驾驶汽车,它的特点是,汽车有了“视觉”,它用摄像头来检测前方标记。


1973年,GPS全球导航系统开始发展,视觉和导航一起,开始取代过去地面铺设导航轨道的思路。


1995年,美国卡内基梅隆大学的无人驾驶汽车,完成从匹兹堡到洛杉矶的无人车跨越美国东西部的旅程。


真正革命的变化发生在互联网公司介入,最知名的就是谷歌和百度。


人们可以从很多角度理解百度和谷歌的无人车,它跟智能的关系有三个关键词:感知(perception),认知(cognition),和云端(cloud)。


无人驾驶汽车,需要能够看到、听懂外部的环境,这就是需要感知,能够了解外部的情况。此外它还需要能够自己做出判断,安全地行使,这就需要认知。更重要的是,这些车辆对外部环境的感知,它们掌握的认知,能进一步计算,能为众多车辆所共享、共用。


我们都知道,过去几年,人工智能的进步,正是发生在这三个部分上。《智能革命》中说:无人汽车绝不是以个体形态出现,而是一个庞大的自主系统,像血管和神经一样连接着其他所有城市系统。


无人车本身就是人工智能技术的集大成者,视觉识别、语音识别、自主决策、机械控制等集于一身,是一台运动的数据收集和处理器。在这个基础上,无人车网络把人、车、环境联系在一起,把个人目的和整体管理联系在一起。一旦无人车成规模运行,又会反过来带动技术发展和物联网的发展。


如果要简单地理解无人驾驶汽车的话,与其认为它是“带着电脑的汽车”,有四个轮子的电脑,不如把它看成是“联网到云端的汽车”。智慧不在车上,智慧在云上。


四、智能作为电力,会如何发展?

过去几年,在互联网、移动互联网产业之外,互联网和实体经济开始融合,互联网公司除了关注它们自己的业务本身,开始试图把自己技术与能力提供给所有人。一方面,互联网背后的技术开始被关注,它通常被总结为两个词——云计算与大数据。另一方面,互联网公司开始把自身类比为公用事业,称自己要提供水、煤气、电。


从互联网、到移动互联网、再到现在的人工智能,我们发现一个绝妙的比喻是:人工智能是未来的电。并且,人工智能是电,还可以把云计算和大数据都融合进来,形成一种通用的能源,提供给各行各业。


我们还可以类比说,“数据是石油,人工智能是电”。沿着这个类比,由人工智能算法和服务器组成的就是发动机,数据能力进去,就变成了通用的电能。


而类似于百度大脑这样的人工智能技术平台,它所想做的是,其实是超大型发电厂。《智能革命》这本书详细介绍了百度大脑,它包括三层:


最底层是硬件,是服务器,用技术术语说就是IaaS(基础设施服务)。百度叫这一层为物料层;


中间一层是平台,人工智能的算法、数据在这一层,用术语说是PaaS,平台服务。百度叫这一层为人工智能基础技术层。


最上层是软件,将人工智能变成适合各行各业的解决方案,用术语说是SaaS,软件服务。


我们可以看到,在这里面,最核心的是:硬件,数据,算法。


在百度大脑开放平台(ai.baidu.com)的页面上,我们可以看到,它现在提供的能力有:图像、语音、视频、自然语言、数据智能等。

大型公司要做的是,不断提高硬件能力,提高人工智能算法的能力。百度没有具体透露它自己的人工智能服务器情况,我们可以从谷歌的进步中看到这方面的惊人变化。最早的AlphaGo需要几千个GPU芯片。


2016年,与李世石比赛的版本需要50个谷歌自己的人工智能专用芯片,也就是所谓TPU。到2017年,与中国棋手比赛的AlphaGo,计算速度比上一年要快十倍,但只要4个专用人工智能芯片。同时高速进步的还有算法,这一次,与柯洁比赛的阿尔法狗,它的计算量只有与李世石比赛的1/10 。


我们看到,人工智能现在不仅仅突破了真正变得有用,而且还在高速发展,因此,我们可以乐观地预期,它很快会变成普遍的电。


五、企业需要一位“首席人工智能官”


《智能革命》建议:传统企业更需要人工智能领域的专业人士来引导变革。它还建议,企业应设立“首席人工智能官”(Chief AI Office,简写为CAO),称他是“引领企业变革升级的人”。


「首席电力官」


回顾历史,在“电”刚出现的时代,许多公司曾经设立电力副总裁,也就是“首席电力官”。


一百年前,用好当时的新技术——电,通过使用电来实现升级,需要处理很多问题,《智能革命》里面分析说:一百多年前的电力系统十分复杂。需要在直流电、交流电,不同的电压、不同水平的可靠性、不同的电力接口以及价格之间做出合理的选择。


和不同电力公司打交道也是个技术活儿,否则很可能吃亏,正如今天企业找互联网技术外包公司时,自己如果不专业,就会落入陷阱。


因此,很多公司设立电力副总裁,他的职责是:帮助组织改革工作,以保证公司内的每个职能部门在自己的工作目标或产品上考虑电的存在。用现在的话说,就是让所有人都有“电力思维”。他的任务包括布置电线、购买电力设备、改造原有设备,甚至改造公司业务流程,比如,电灯使得夜班成为标准。



随着技术和互联网的发展,很多公司也设立新的负责人来负责使用新的技术,比如首席信息官(CIO),负责公司的信息系统;比如采用互联网技术的公司,会设立负责技术和产品的首席技术官(CTO)等职位。在大数据盛行的时候,也有人提出,企业应当设立首席数据官(CDO)。这些职位名字,实质反映的是技术的进步。


《智能革命》提出“首席人工智能官的修养”,要有两层能力:第一层是数据能力;第二层是场景能力。当然,它这里假设的是,首席人工智能官是一位专业人士,有着人工智能的基本能力,这也可以说是第0层。我们来分别看看,这三层能力:

首席人工智能官修养的第0层:人工智能能力。


首席人工智能官不一定是计算机科学家,对算法和代码了如指掌。但他需要对人工智能的基本原理有深入了解,了解行业的最新进展。在快速变化的行业,只有了解最新的技术进展,才能进行正确的战略选择。


他需要深入理解人工智能的应用原理。一个重要挑战是,是否能找到落地的用户体验、实现用户价值的场景、适合的商业模式,建立一个“人工智能创新飞轮”。这个飞轮包括四个部分:数据—知识—用户体验—新的数据。(用人工智能技术将数据变成知识,然后变成服务用户的产品,产品在运转中,又产生新的数据,循环往复,滚雪球式前进)


因此,一个首席人工智能官做的就是:引入成熟的机器学习方法,把数据变成训练材料,塑造自动化机制,或者合理引入第三方人工智能流,找到一个合适的创新循环,在这个过程中创造商业价值。


首席人工智能官修养的第1层:数据能力。


首席人工智能官也应该是一位数据专家,他能够利用公司已经收集的海量数据,找到从数据挖掘价值的方法。其中最关键的是,有能力从纷繁的数据中嗅到可能有的关联。


首席人工智能官修养的第2层:场景能力。


首席人工智能官要能从用户场景出发,设计能满足用户需求的产品,这个产品又要能让公司的人工智能创新飞轮更加强大。


MIT的教授、《第二次机器革命》的两位作者(埃里克?布莱恩约弗森、安德鲁?麦卡菲)最近在哈佛商业评论刊登文章指出,人工智能和机器学习会在三个层次上驱动企业的变化:工作任务和职位、业务流程和业务模型。


总的来说,《智能革命》建议,为了迎接人工智能时代,每个企业都需要有一个首席人工智能官。在互联网时代,像乔布斯这样的产品大师,是大家的偶像。《智能革命》认为,首席人工智能官,是新时代的企业偶像。


六、一个国家,是否也需要一位人工智能部长?


从更宏大的视角。人工智能是互联网、移动互联网之后的又一波技术浪潮。有人将它放在更长的历史潮流中看,认为智能革命是堪比工业革命的第四次技术革命,前三次分别是:蒸汽机、电气化、信息革命。


那么,如果说为了迎接“智能革命”,每个企业都应该有一位首席人工智能官,那么一个国家是不是应该设立一个“人工智能部长”呢?


是的,人工智能现在正成为一些国家的国家级战略。


2016年10月至12月,美国白宫科技政策办公室连续发布了三份人工智能战略报告,分别是《为未来人工智能做好准备》《国家人工智能研究与发展策略规划》和《人工智能、自动化与经济》。


2017年7月,中国国务院印发了《新一代人工智能发展规划》,其中指出:人工智能是引领未来的战略性技术,世界主要发达国家把发展人工智能作为提升国家竞争力、维护国家安全的重大战略,加紧出台规划和政策,围绕核心技术、顶尖人才、标准规范等强化部署,力图在新一轮国际科技竞争中掌握主导权。


《新一代人工智能发展规划》也提出要建立5种基础支撑平台和3种智能化基础设施。

点击查看大图

这些规划,反映出国家正向“智能化”转型,类似过去提的电气化、数字化、互联网+等。


在这个背景下,我们会发现,百度建立自己企业的“百度大脑”开放平台,和李彦宏呼吁建立“中国大脑”有着很大的意义。


在2015年全国两会,李彦宏提交了一个提案:设立“中国大脑计划”的提案。他建议:由国家投入专项资金主导,尽快搭建全球最大规模的人工智能基础资源和公共服务平台,比如建立一个拥有几十万台服务器的大型人工智能平台。


他认为,这将是新一轮工业革命的助推器。基础研究的成果应该让更多中国企业受益。包括语音识别、图像识别、自然语言的理解、多语种的翻译,甚至无人驾驶汽车、无人驾驶飞机、智能制造方面的机器人都可以在这个平台上进行各种各样的创新和实践。


现在人工智能技术大发展,正因为三个条件都具备了:算法、计算能力和大数据。


沿着人工智能是新时代的“电”这一类比,我们或许可以说,人工智能是“发电机”,而大数据是石油。目前人工智能技术公司在努力建立的,是更好的发电机;试图建立人工智能开放平台,则更像是建立大规模的发电厂。


也有些人工智能技术公司,正在建立电动机,并帮工厂把原来的设备改成用新时代的“电”。相应地,对所有企业来说,面对人工智能的变革,要做的是尽快用上新时代的“电”,用它来变革自身。


以新时代的“电”这个类比,再看国家级战略的《新一代人工智能发展规划》,我们可以这么理解:


  • 它试图让中国掌握核心技术,自主制造自己的发电设备;

  • 它试图建立全社会能用的发电厂和电网,建立新时代的电力系统;

  • 它试图推动人工智能这种新的动力能源在经济和社会中的实际应用。


像过去工业革命中的蒸汽机动力、电力动力、互联网(或数字化)一样,人工智能是第四次工业的动力能源。过去数十年互联网的大发展,让中国在大数据、算法研究和计算能力上有着独特优势。人工智能不只是产业机会,也可能是国家的机会。


七、课程小结


  • 从互联网,到移动互联网,到人工智能,技术逐浪而行,我们正进入人工智能的浪潮之中;

  • 搜索引擎是现在最大的人工智能项目。通过仔细看搜索引擎,我们可以从现在看到未来;

  • 无人车是人工智能最大的应用场景,它反映了智能在云上的关键逻辑。


读李彦宏的《智能革命》,以“人工智能是未来的电”这个比喻看:现在,发电厂在快速进化,这种未来的电用途正在被创造出来,无论个人、企业、还是国家,都应当抓住这样的变革机遇。

本周,喜马拉雅FM专栏“方军的互联网读书会”深度解读《智能革命》,周一、周四上下两篇,均可免费试听。相信热爱学习的你,一定不会错过~


首页 - 笔记侠 的更多文章: