▲主讲嘉宾: 梅宏 北京理工大学副校长、中国科学院院士
软件一定是未来世界非常重要的一个元素。
它和我们人的智能目前还不是一个概念,这种东西叫做“类人智能”。
网络空间里面,怎么能够保护自己国家的安全?
梅宏:同学们好,欢迎来到《大学》。大家知道现代信息技术两个最重要的核心,一个是芯片,在芯片之上让芯片运行起来的就是软件。今天我就想和大家聊一聊我自己的专业——软件。
软件一定是未来世界非常重要的一个元素。我想从大数据开启了信息化新阶段、无处不在的软件、软件定义的未来世界三个方面来讲。
大数据是信息化发展的新阶段
去年12月8日,十九届中共中央政治局举行第二次集体学习,习近平总书记在学习会上发表重要讲话,一项重要内容就是谈到大数据是信息化发展的新阶段。
中共中央总书记习近平在主持学习时强调,大数据发展日新月异,我们应该审时度势、精心谋划、超前布局、力争主动,推动实施国家大数据战略。北京理工大学副校长、中国科学院院士梅宏就这个问题作了讲解,并谈了意见和建议。
梅宏:怎么来理解这一句话?为什么说大数据是信息化发展的新阶段?如果我们回顾整个信息化的发展历程,大体上过去已经经历了两个阶段,或者说已经有了两波高潮。第一波信息化高潮诞生在上世纪70年代末80年代初,随着个人计算机的广泛应用,开始了一个全球化的信息化浪潮。那个时候的信息化如果把它描述出来,就是以PC机应用为主要特征的数字化阶段。
随着上世纪90年代中期美国开启信息高速公路计划,互联网开始了大规模的商用进程。大家知道互联网的发明是60年代末的事情,它在90年代中期才完成了一次大规模商业化,随着这个进程延续了20多年,信息化进入第二波浪潮,第二个阶段是什么?以互联网应用为主要特征的网络化阶段。
随着20多年互联网的快速发展以及快速应用,到我们现在开始进入了新阶段,在这个阶段我们有大量的数据资源的积累和无处不在的信息技术应用,我们进入一个新的阶段,叫作以数据的深度挖掘和融合应用为主要特征的智能化阶段。
数字化、网络化、智能化
数字化、网络化、智能化,怎么理解这三个化?数字化奠定基础,解决我们数据资源的问题。网络化提供平台,让我们的数据资源能够在网上进行汇聚、流通和交换。而智能化是展现能力,是把信息技术的应用通过我们人能感受到的类人的方式展现给大家,这三件事情在整个历史上是并行不悖的。
如果我们回过来再看这三个阶段,数字化走过来是一条线,网络化是一条线,只是开启的时间不一样,现在我们正在开启一个新的智能化的线。数字化本身也经历了相应的几个阶段,每个阶段数字化有它不同的特征。第一个阶段的数字化实际上解决的是办公数字化的问题,第二阶段数字化的重点是社会数字化,我们现在开启的数字化是万物的数字化。网络化从过去20年互联网、移动互联网,现在正在走向连接万物的物联网时代。智能化当然我们谈到了正在开启。
让每一个人享受人工智能的便利,你即将听到的是人工智能和一家真实理发店的对话,来为你预约造型师的时间。让我们听听吧。
理发店店员:您好,有什么可以帮助您的?
人工智能:你好!我为客户预约一下女士美发。5月3日有时间吗?
理发店店员:好的,您稍等。
人工智能:嗯嗯。
理发店店员:没问题,您想几点来?
人工智能:上午十点到十二点都可以。
理发店店员:十点有档期。
人工智能:可以。
理发店店员:好的,那位女士怎么称呼?
人工智能:她叫莉莎。
理发店店员:好的,那告诉莉莎,我们3号10点见。
人工智能:好的太好了!
理发店店员:祝你好心情,再见!
【互动环节】
学生1:梅院士您好,刚刚您提到人工智能,未来人工智能的发展对我们软件学科和整个行业有怎么样的影响?
梅宏:人工智能在现在是很热的一个话题,确实我们也看到了很多非常成功的人工智能的应用。
柯洁:对我而言这就是围棋的上帝,AlphaGo出现之后,真的,我对人生有了一个巨大的改变和看法。
梅宏:我理解到现在为止目前我们体现的智能还是数据驱动的智能,那么数据驱动的智能现在主要靠的是什么?它和我们人的智能目前还不是一个概念,所以从我个人来讲,我更希望将这种东西称之为“类人智能”,它做起来好像跟我们差不多,解决我们过去认为智能能够解决的一些问题。计算机出现以后,很多计算的事情我们人也不做了,基本上都交给计算机去做了。所以同样现在智能这种信息处理的事,计算机处理起来比我们要有力得多。
所以我想人工智能会让一些低端的工作岗位被机器或者计算机所取代,但是它一定和传统的技术一样,创造出一些新的、适合于人去做的岗位,毕竟人才是这个世界的万物之灵。
什么是大数据?
由办公数字化到社会数字化,最后到了万物数字化。现在随着数据资源大规模的积累就出现了大数据。
到底什么是大数据?我这里有两个定义,一个是从能力的视角说,大数据是什么?就是现有的信息处理能力或者现有的计算能力所没有办法去处理和存储的数据,这是一个相对与时俱进的定义。另外一个就是我们经常讲的大数据的内涵,是什么呢?第一具有海量,量要大;第二高速,产生的速度快;第三多样性;第四可变性。大数据是这几个特征所汇成的一个多维的数据集。毫无疑问,这样多维的数据集需要我们在技术上有新的一套体系完成这样的数据处理。
看一些具体的例子,比如数据到底有多大?IDC有一个统计,2003年全球产生的数据量大概就500万个TB。2009年的时候全球的数据是0.8个ZB。我最新看到IDC2017年出的估算,到了2020年我们数据会到44个ZB。
一个ZB到底有多大?如果说我们把三分钟的歌曲制成MP3格式,用最高质量的MP3格式来录,如果把这些歌曲存到一个ZB的空间里面能存多少?140万亿首,我们每个人想把140万亿首听一遍,差不多要8亿年。这是非常庞大的数字。
大数据给我们带来什么?
前几年有一个美国防务承包商,它的一个雇员斯诺登就出来揭秘,披露了美国当时正在做的“棱镜”计划。
斯诺登:在美国有一个世界性的设施。基本上说人类社会的绝大部分通信,也包括机器之间的通信,可以被不经指向地自动获取,这能让操纵者搜索你的通讯信息。
梅宏:“棱镜”计划当时对全世界影响很大,因为美国透过“棱镜”计划在收集他的公民、他的对手还有世界各国的各种信息来进行综合处理,它事实上是危害到了别的国家的安全、侵害到了别国的利益。所以在这种意义之下,我们国家怎么能够保护自己国家的安全?
一个国家的国土安全,陆、海、空、天都是主权空间,现在在信息时代,我们又有一个新的空间是什么?网络空间,Cyberspace。网络空间里面如果没有自主可控的、足够高水平的能力去维护这个空间,就保障不了国家安全。
大数据给我们带来什么?它的价值和意义是什么?它是人类认识复杂系统的新思维和新手段,是提升国家综合能力、保障国家安全的新利器,是提升政府治理能力的新途径,也是促进我们经济转型的新引擎。
什么是数字经济?
刚才我谈到对经济增长的作用,国际多个权威机构也都提到,大数据对GDP整体拉动的作用大概是2%到4%。我记得我刚到北京不久,当时我在北大工作,我的老师杨芙清经常讲的一句话就是信息技术不仅是一个独立存在的行业,还广泛地渗透到别的行业和领域,成为别的行业或者领域的催化剂或者倍增器。而现在到了一个什么时代?你不拥抱信息技术、不完成数字化转型,就会被颠覆掉。信息技术会成为很多传统行业的颠覆者,它也会成为新经济形态的一个引领者和驱动力。
这就是现在国家在大力倡导的数字经济,数字经济是以新一代信息技术和产业为依托,在农业经济、工业经济之后的一种主要经济形态。所以说什么是数字经济?数字经济,数据是关键的生产要素,网络是平台和重要的载体,而信息技术的应用就是重要的推动力。也就是说数字化、网络化、智能化这三件事情是数字经济的主线和主轴。
软件发展的三个阶段
再回过来看我们软件的发展,早期从第一台计算机诞生一直到上世纪70年代中期,我们把那个阶段称之为软硬一体化阶段,软件并没有自己完全独立的位置,以硬件附属品的方式存在。但是软件学科的存在是什么时候呢?上世纪50年代末60年代初开始出现“软件”这个词,那时候人们开始认识到软件相对硬件有很大的一个重要性。
第二阶段是从1975年前后,以当时两个有名的软件公司,一个是Microsoft,还有一个就是Oracle的诞生为标志,软件开始成为独立的产品,开始独立地销售了,从此就诞生了一个非常重要的产业叫作“软件产业”。
同样也是在上世纪90年代中期开始软件进入一个新的阶段,叫作网络化和服务化的阶段,从软硬一体化阶段到产品化、产业化阶段,到了后面的网络化、服务化阶段。
第三个阶段是网络化、服务化阶段。随着互联网开始进入我们的生活和工作,软件从单机环境向网络环境开始延伸,这个时候软件的形态就从单机时候的拷贝方式开始变成服务化的方式。这种服务化是什么?你把需求告诉它,它把处理的结果返回给你,这就是在服务器端,不管服务器在哪里,你通过这种方式来获取软件提供你的能力,这就是一种软件服务化。
第二种方式就是所谓的APP。APP我们现在每个人都在用,移动互联网起来以后,它产生了一种新的应用模式。APP介于原有的安装拷贝式和完全服务化的方式之间,与通过浏览器使用的方式不太相同。我们要装一个小的APP在终端上,同时它和云端、和服务器紧密结合来完成任务。所以现在用的APP是两大阵营,一个是苹果阵营,一个是谷歌、安卓阵营。苹果的App Store和谷歌的Google play基本上都有几百万个APP在上面,累计下载量已经是千亿次、万亿次的这么一个量级。
软件产业保持高速增长态势
梅宏:我也是一个普通的软件使用者,每天起床的第一件事,就是打开新闻;上班第一件事打开邮件,看看有没有邮件到来;公文的批转是通过办公系统。我没有去仔细地算,每个人每天得用多少不同的软件。所以我说未来的人类是运行在软件基础之上的。
软件开始出现以后,软件产业始终保持一个高速增长的态势。如果说软件行业在上世纪七、八十年代还是起步阶段,那么2017年全球软件产业的收入已经是4500亿美元,这是一个很大的量。
比尔·盖茨从他创立公司开始,二十几年间,在1999年他的财富是多少?540亿美元。微软公司的产值超过了美国三大汽车公司产值的总和。这里我用了一张图片,能看到里面有我吗?那还是我年轻的时候,比尔·盖茨第一次来中国。青鸟Ⅱ型系统,这是杨芙清院士领导的国家科技攻关项目,我在负责青鸟Ⅱ型系统最后的集成。正好他来的时候赶上我们系统差不多结束,那次他到我们实验室来参观,是第一次到中国,选了一个软件实验室来参观。所以当时有幸留下这么一张照片。
当时美国经济增长的主要来源是什么?5000家软件公司,硅谷市值已经到4500亿美元。但是美国是汽车最发达的地方,在上世纪末本世纪初的时候,以底特律为中心的美国三大汽车公司的市值总值大概也就1130亿美元。大家知道到现在底特律基本是一个破产的城市,美国在新的西部、硅谷产生了一片新的产业天地。
那我们再看现在的数据。2018年雅虎财经公布了数据,全球市值排在前五位的公司:苹果排第一,8790亿美元;谷歌7015亿美元;微软6947亿美元;亚马逊6802亿美元;还有腾讯4928亿美元。这些公司很多都是以软件为核心业务的公司,特别是微软。那么亚马逊的创始人贝佐斯是全球首富,比尔·盖茨维持了很长时间的全球首富,他个人拥有1050亿美元。乔布斯曾经说过一句话:苹果公司的秘密就是,也可能不算是秘密了,就是苹果把自己视为一家软件公司。
梅宏:从当前来讲软件产业仍然是规模最为庞大的产业,也是很有朝气、很有蓬勃生长力的产业。首先,我们从全球规模来看,全球有19个国家软件支出占国内生产总值GDP的比重超过了0.5%,其中美国软件支出占GDP的比重超过了1%。第二,从从业人数来讲,2014年的数据,全球信息技术产业从业人员2900万人,其中专业开发人员大概是1100万人,而同样我国的软件从业人员也在不断地增长,我们是576万人,这两个都是官方的数字。
【互动环节】
学生2:梅院士您好,您幻灯片里有一张照片,是您在向比尔·盖茨演示我们自己的软件系统。这么多年过去了,您怎么看待当今中国的软件产业和软件技术?它有哪些发展进步?在哪些方面还需要更加努力甚至需要一些转变?
梅宏:这是一个很好的问题,也是我们这一代人特别想回答好的一个问题。我从读书开始就是在学计算机,一直在这个领域,我基本上就是做软件。我到北大之后,当时是青鸟系统,青鸟系统目标叫作计算机辅助软件工程,就是要让计算机来帮助我们的程序员去编一些软件,解决这么一个问题,这个是上世纪80年代国际上比较热的一个东西。
应该说我经历了青鸟系统的几个阶段。早期就是学习,把国际上的结构化的编程东西拿过来,支持结构化方法的软件开发环境;后来当我们做面向对象的时候基本上比国际上晚一点点,到后来构建化平台基本和国际上平行在走。2000年以后我们开始围绕互联网在做自己的新东西,在国际学术界开始有了一些声音。现在实际上就软件而言,中国软件界在国际学术界表现还是不错的。但是转过来在操作系统这个层面我们一直就没有解决,我们曾经做中间件还不错,也能够替代国外的产品,但是总体要形成竞争的态势、竞争的能力还是不行。因为软件它相对而言又带来另外一个问题,向上受制于应用,向下受制于芯片,所以它独立发展的难度还是比较大。如果说我们不能够自主掌握这些技术,形成自己可控的这一套系统的话,我们的竞争能力和国家安全都是没法保障的。
全国网络安全和信息化工作会议20日至21日在北京召开。中共中央总书记、国家主席、中央军委主席、中央网络安全和信息化委员会主任习近平出席会议并发表重要讲话。他强调,信息化为中华民族带来了千载难逢的机遇。我们必须敏锐抓住信息化发展的历史机遇,加强网上正面宣传,维护网络安全,推动信息领域核心技术突破,发挥信息化对经济社会发展的引领作用。
梅宏:这几年的进步应该看得很清楚,不管是学术上的进步、技术上的进步,我们只要保持这个态势下去,我相信有一天可能在在座的年轻人身上,大体上能够看到这种状况,我也希望有这么一天。
软件成为人类社会重要的基础设施
梅宏:互联网能够产生价值的核心机理就是连接。软件的安全对信息安全是至关重要的。
我们来看一看网络本身是因为什么产生价值?互联网能够产生价值的核心机理就是连接,大家知道有一个梅特卡夫定律,就是说网络的价值与网络用户节点数的平方成正比。所以说网络越大,它与节点数的平方成正比,网络的价值也就越大。
这个时代一个非常重要的趋势,叫作“软件正开始成为人类社会的基础设施”。我想从两个方面理解,第一方面就是在信息基础设施里面,软件是非常重要的一个构成成分。第二个方面就是随着人、机、物融合时代的到来,传统物理世界的基础设施也面临着一次新的改变,我们要用软件去重新定义这些传统的基础设施,把传统物理世界的基础设施完成数字化以及可定制化。以上这些东西构造起来的这两个方面的含义,导致了软件将会成为人类社会的基础设施和支撑我们人类社会运行的一个不可或缺的元素。
所以说软件无处不在。它在为我们的社会、为我们每一个人赋能、赋值、赋智。我再用两个名人的话来总结一下,一个是Netscape的创始人马克·安德森。大家知道Netscape吗?网景,是第一个浏览器公司。马克·安德森说一句话:往大了说,软件正在“吞噬”世界。
梅宏:还有一个人是美国的工程院院士,C++语言的发明人,叫作本贾尼·斯特劳斯特卢普。他说,人类文明将运行在软件之上。
软件时代的信息安全
我们说现在的国家安全,信息安全是其中非常非常重要的一个方面,信息安全问题已经成为事关经济安全、社会安全、国防安全的“第一安全”。软件实现了对信息的存储、加工和传输,因此说软件的安全对信息安全是至关重要的,它是整个网络空间安全里一个非常非常重要的要素。未来随着软件的“基础设施化”,很多东西都要靠软件来管理。比如说工业控制靠软件。工业要联网,形成工业互联网,这是一个必然的趋势,你不能说回避这个趋势发展,但是同样它里面带来了一个很重大的安全问题。未来我们的军事、我们的工业、我们的金融等等都要联网,都要和各个网络关联,这些重大领域的安全都必须建立在软件安全的基础之上。现在国内很多制造业都在完成新一轮的、和信息化的结合,比如说要解决数字化问题、网络化问题和进一步的智能化问题。这里面软件的作用就非常重要了,它不仅是一个使能技术,而且如果你的安全问题解决不了,在工业制造领域所带来的损失会比我们平时日常生活中其他一些应用所带来的损失大得多。
【互动环节】
学生1:梅院士您好,您刚才提到了安全方面的事情,您对隐私还有大数据这两者的取舍有什么看法?
梅宏:在大数据时代,确实由于这种数据的融合应用,由于我们每一个人和信息空间的紧密绑定,每个人的隐私都受到很严重的挑战。除了个人隐私之外,实际还有一个大问题是安全问题。数据的安全和隐私已经是全世界学术界、产业界都在关注的一个重点。这件事情我以为是不能够单靠技术方案来解决的,技术方案只是提供一个辅助。它应该是从法律法规这个源头开始,从我们社会的自律、我们每一个人的自律这个角度来开始,形成一个多方来做这件事情的局面,才可能做到保护数据安全和隐私。
但如果说回顾人类社会每一次进步,客观来说都是以人的很多方便为进步,同时又让人的很多方面被打扰为代价的。怎么从立法层面、技术层面和道德层面综合地考虑这件事情,让我们每一个人都尽可能不受数据滥用的影响。
软件定义的未来世界
现在我们这个社会已经离不开软件了,未来会怎么样?那我们说,“软件定义的未来世界”是我想讲的最后一部分。
未来是一个人、机、物融合的环境,在人、机、物融合的环境里面,信息基础设施是什么?是海量异构的各种软硬件资源。这就是经常讲的云、管、端,还有物,各种设备在一个网上连接,还有我们人的介入,各种资源是海量异构的。同样在这个环境之下各种新型的应用需求会层出不穷,需求形态多样。各种新的计算模式,我们要支撑共享经济,支撑各种应用商店,支撑社交网络、人工智能应用、电子商务、电子政务等等。
在这种情况下要解决这种问题,按照软件长期发展的思路,需要我们构建一个软件平台。这个平台向上为各种各样的应用提供共性的服务,也就是要凝练共性,把各种应用需求的共性凝练下来,放到平台里面。向下要把这些资源管起来,把海量的异构资源管起来,那就是软件平台。
软件平台要应对应用场景的动态多变,也就是说能不能做到按需地定制。不同的人可以给你定制不同的平台,不同的组织也可以给你定制不同的平台,这就是软件定义。那什么是软件定义?软件定义就是把硬连接的一体化的基础设施,把它中间的一些部件通过软件虚拟化的方式提供可操控的接口,然后再用软件把这些接口连起来,使得硬件能够实现灵活地互联。
所以我一直说软件定义的本质是通过虚拟化及应用编程接口把硬件的可操控的成分暴露出来,然后按需实现硬件的管理。两句话:基础资源虚拟化,管理任务可编程。如果就这个定义而言,大家想一想,我们的计算机操作系统就是这么干的,向下管硬件资源,向上支撑各种各样的应用服务。
梅宏:编写出一个软件操作系统,我们能力是具备的。但问题是,怎么让它的生态建立起来。因为你做出一个操作系统,做出一个系统软件,要有人用,要有人在这上面开发各种应用软件,这才是最关键的。现在我们要破解这样一个问题,这个不是靠喊口号的,我相信还要靠一代一代的人努力才能做到。
软件定义的城市
这个里面就有很多概念出现了,比如说“软件定义的城市”。
比如2012年,BBC报道了伦敦在部署所谓的“智能城市操作系统”:
明天早晨,科技将帮助我们完成有史以来最安全的奥运盛会,上千部闭路摄像头将和全市50多个控制站点连接,市政府将和公安、消防、场馆、交通等机构实时监控、记录并共享公共场所和场馆的数据,数字化的基础设施将大幅度提升每个人的安全度和舒适度。
梅宏:智能城市也是软件的架构,把传感器层、控制层、监控层和应用层弄起来,形成这么一个平台,形成一个整个城市的软件定义。随着这种人、机、物的融合在物理世界的延伸,城市里面各种信息物理基础设施以开放、共享、智能、连接的方式,通过软件的方式来实现,从而支持城市对各种硬件基础设施还有人活动的精细化管理,这就是“软件定义的城市”。
现在人工智能很火,各种人工智能的应用成为发展的一个大热潮,但实际上我们现在的人工智能总体上还是算法人工智能。如果说我们通过一种通用的平台,提供通用的框架能不能支持各种人工智能应用的按需定制呢?我想这应该是值得探讨的一条路。我们要通过软件的角度打造一个支撑各种智能化应用的平台,这是软件的思路。
基于软件定义,就是刚刚我讲的操作系统本身,实际上我们要解决什么问题?就是要解决一个各种各样的物体、各种各样的平台、各种各样的组织的操作系统的问题。这就是我提出的一个概念,叫作“泛在操作系统”,Ubiquitous Operating System,就是UOS。这也就是未来的操作系统将从计算机的操作系统要变成各个行业的、各个组织的甚至家庭的、城市的操作系统,这些东西都是通过软件定义来实现的。所以我把软件定义看作是一种技术方法、一种思维途径、一种实现途径和一种操作系统平台展现,它实际上是可以划上等号的。
【互动环节】
学生2:梅院士您好,作为一个中国人,一个中国软件工程专业的学生,其实我更关注的还是自己国家的问题。我想知道我们这二十多年来,我们跟世界之间的差距有没有缩短?我们到底有没有什么特长?能不能跻身于世界前列?
梅宏:首先我想说结论应该是肯定的,我想我们正在进入一个新时代,一个好的时代。而且中国这个火车头开起来,谁也挡不住,我们的发展是必然的。我们和发达国家比,优势在哪儿?就是后发优势,我们没有前面那么多的历史包袱,和发展中国家比我们的优势是什么?我们正当其时,他们没准备好,我们准备好了。所以我想这是历史给我们的窗口期。
二十多年来,我认为我们取得了长足的进步。像我没有留过洋,我只是在1999年的时候去贝尔实验室待过一年,其余时间一直在国内成长。我觉得我们现在很多的学术成果,我们很多的一些技术产品,我们和国际上比并不差,所以这就比我们过去仰头看西方时的差距大大地缩小了。
但是科学研究、技术发展还是有它的规律的,很难一蹴而就,毕竟我们是从一个一穷二白的基础上开始的。在新的生态模式之下——比如说现在可以看到硬件开放的趋势已经很明显,软件开源也已经成为气候——所以在这个基础之上我相信我们要构建一个自己的、可控的体系应该是可能的,只要我们有这个自信心,然后同时有大家共同的努力。
万物皆可互联 一切均可编程
未来世界是一个人、机、物融合的世界,我们需要把各种各样的信息资源连到一起,同时信息资源又要和各种社会资源、各种物件、各种设备硬件资源关联起来,还有支撑我们各种各样的应用模式,在大数据、人工智能、共享经济、平台经济等等新的概念之下形成的一个场景。这个场景是什么?从软件的视角来看,就是“万物皆可互联,一切均可编程”。这些东西要靠软件定义的方式来实现,所以说未来世界一定是一个离不开软件的世界。这就是我今天讲的主题——为什么叫软件定义的未来世界,谢谢大家!
编辑:顾军
责任编辑:樊丽萍
来源:中央纪委国家监委网站