中国工程院院士、合肥工业大学管理学院教授
杨善林
一、互联网与大数据的资源观
互联网与大数据发展到今天,已经成为一种非常重要的战略性引导资源。互联网它不仅仅是一个通信平台和交流平台,而是一个资源融入到经济社会当中,像石油、天然气一样。这种资源全面融入到经济社会系统运行的全过程,广泛渗透到生产生活的各个方面,促进线上线下资源的融合与重构,从而推动生产和生活方式变革。
二、信息服务系统与人工智能
互联网和大数据资源融入到社会经济发展过程中需要信息服务系统来支撑。信息服务系统不管是哪一类应用,首先要有一个很大数据存储功能和非常好的数据存储结构。另外还有数据处理方法,这个方法要作用到数据存储结构上,才能把每个社会资源用活、用好;然后在这样的基础上,它需要拥有数据处理系统,主要是对数据进行处理和服务,然后是访问平台和人机交互界面,这是信息系统的通用结构。但大数据的特性给传统数据库系统带来了多种挑战。
在数据方面,以前数据是单模态的,即结构化数据,对于不同领域的上层应用,传统数据库系统具有通用的、完整的数据管理功能。而现在大数据是多模态,是非结构化的数据,有各种各样的数据。第二个是静态型和动态性,传统的是事先确定数据模式,并需要满足事务操作所有要求。而现在是动态性,多种类型的数据是快速增长,导致数据模式无法预先定义,难以支持事务特性。所以传统的那些系统如果是SQL,很难适应大存储数据系统。所以我们新型数据库NewSql、Nosql等在快速发展。那么这个Nosql是非关系型数据库,目前市场上也已经有很多在销售和应用。Newsql也是一类,是高性能的数据库,是一类新型关系型数据库管理系统。这是数据存储结构发生变化了,提出了新要求。
在数据分析方面,从数据分析对象来说,以前我们处理的是经过预处理后的数据,而大数据是希望处理那些原始数据,是多源多模态数据。另外一方面数据分析的需求也发生改变了,从相对简单的一般分析向精准的个性化分析发展。比如说早期物流系统只要能够支持物流资源的整体配置,这个系统就已经很好用了。而当前希望动态实时的精准物流资源配置优化,要求就比以前高很多。在数据分析方面,从分析较为直观的一般特征向分析复杂关联的深层特征推进。比如我们早期需求主要是发现物流资源与需求之间的关系,这就可以进行匹配,而现在是希望将资源平台、货源平台以及解决方案平台等整合,构建智慧物流生态。从数据分析技术来说,从表达力受限的低维数据分析技术向高信息量的高维数据分析技术转变。从分析能力来说,从小范围有效的弱泛化能力向广泛有效的强泛化能力提升。泛化能力是指什么意思呢?以前讲人工智能,我有一部分数据拿来学习建立模型,然后这个模型新的数据可以适用,形成了以后通过这个模型就可以达到想到结果,我们就说模型的泛化能力很强。目前,通过对现有的可视化的展现、统计分析、积极学习等技术在的扩展,大数据分析应用有了不错的进展,但大数据分析能力的提升仍然需要创新性、颠覆性的方法。
以上的这些数据存储和数据处理方法,都要依据一个数据平台。而这个平台有两大关键技术,一是云平台,也就是集中存放。云平台是一类重要的大数据处理平台,涉及以数据存储为主的存储型云平台、以数据处理为主的计算型云平台以及计算和数据存储处理兼顾的综合云平台。云平台能够以低成本、按需满足用户对数据处理的需求。那么一个大的云平台如何满足各种不同用户的需求呢?那就是通过软件定义,软件定义通过硬件资源虚拟化和管理功能可编程,将统一的平台“定义”为满足不同需求的领域平台。另外就是现有的以通用性考虑为主的IT体系很难满足大数据的需求,整个IT架构将迎来革命性的重构。
那么新一代信息技术重构了生产、分配、交换、消费等经济活动各环节,形成从宏观到微观各领域的智能化新需求,使得人工智能在城市、制造、医疗、机器人、物流等各个领域成为关键技术,从而进一步促进了当前人工智能的快速发展。近十年来,随着互联网、移动互联网、传感器网和感知设备等的发展,形成了快速便捷的人网交互以及普适泛在的人机共融的信息环境,呈现出网络化、数字化和智能化的特征,从而成为当前数据驱动的人工智能发展的主要动力之一。当前,以深度学习和强化学习为代表的人工智能实现方法,侧重于数据驱动的智能模拟、延伸和扩展,强化和发展了感知、认知、决策等各阶段的视觉、听觉、语言、推荐、预测等技术能力,促进了人工智能在社会经济各领域的广泛运用。
人工智能是一个新词汇,其发展大体上有三个阶段。第一个阶段建立在知识表示与推理机制基础上的人工智能技术,那时的人工智能主要是模拟人的逻辑思维。例如,如果A则B,如果C则D,变成一个逻辑公式,把这些公式在成熟的基础上应用。如果出现A情况就知道是D,出现B情况就知道是C。早期人工智能用这样一种方式来表达人的知识是极其有限的,所以虽然在一些领域得到了广泛应用,但是这种应用很难推广,所以就冷落下来了。后来,由于人工神经网络这样的出现,机器学习科学技术的出现,人们开始思考能不能通过机器学习让计算机来模拟人的经验思维。这就不是一种逻辑了,而是把人的经验数据收集过来,训练一套网络。这个网络驯化好了以后,当出现新情况的时候,就把新的情况输入到这个网络,得到新的结果。但是很可惜,人们后来发现,建立在这种机器学习基础上的、模拟人的经验思维,和早期人工智能类似,泛化能力很差,新情况出现就推演不出新结果,所以人工智能又走入低谷。当前,人工智能又很热,我们认为主要是建立在大数据和深度学习基础上的人工智能技术,这两者结合之后产生一种新的功能,使得我们人的很多经验能够真正地得以利用。比如阿法狗是最典型案例,把大量的棋局收集在其系统中,然后通过多层人工神经网络学习,判断出现什么棋局的时候什么方案最好,就把什么方案调过来。所以人很难赢它,做得很成功。当然它本身的方法能力不是很强,除下棋外,做其他事情不一定行。人工智能的方法有多,最近又出现了一种叫“强化学习”的方法,通过让机器学习系统基于外界环境的奖励或惩罚等反馈,不断提升机器学习系统的性能。典型案例就是AlphaGo Zero,完全从零开始,不需要任何知识,完全靠自身强化学习,以100:0击败AlphaGo。还有一类迁移学习,把一个环境当中得到的学习方法迁移到另外一个环境中;还有叫生成树对抗网络,也就是针对一个问题,我有一种方法,那么另外一个软件就专门从方法上找问题,去攻击它,一直到最后攻击不动了,攻击不了了,那生成树就不错。
在这些信息服务系统和新的智能算法基础之上,人们对未来的社会发展充满了幻想。未来的交通物流系统,是天地一体化的。飞机、高铁、公路和各种物流运输设备的实时运行数据都感知反馈到我们的信息服务系统中。比如说车辆的情况、路面的坡度,天气情况等等一系列的信息都通过网络采集传送到我们的信息服务系统,构建一个多维覆盖天地一体化的交通物流系统。那么这种交通物流系统要管理,道路交通要形成大量的车联网,车和车相互关联;水路交通要有船联网;航空交通有空联网。而这些车联网、船联网、空联网再通过互联互通的网络形成一个综合的物流系统发展新特征,也就是车联网能实现车路协同,船联网形成船岸协同,空联网形成空地协同。这样一个系统就需要天空地一体化的网络来支撑,大数据就是通过这种无缝覆盖的多维度的感知获取,形成通过数据的汇聚、辨识、关联,形成对物流有价值的物流大数据。而这种物流大数据通过分析就能够进行柔性计划、多元融合形成智能响应。同样,通过大数据能够实现按需匹配、跨界使用实现智能配准,还能进行组合优化、人机交互的智能推荐。
阿里巴巴给杭州规划的未来城市交通方案,中间是他的城市大脑,是海量异构数据机复杂进程的处理中心。而其他高铁、汽车等,都是实现的神经末梢,实现下意识反应,达到局域与中心的协同融合。未来系统要适应人的需要,比如说我们从北京天安门广场要到合肥文旅城开会,你现在考虑的是我怎么来机场,然后在机场怎么安检,然后怎么进飞机,下飞机我又怎么办。将来,你只需要买一张票,从北京家到文旅城,路线全部规划好,系统按照你的要求给你选择了路径,什么时间从家出发,车什么时候到达你家楼下接你,全部都给你办好。未来,我想物流也应该是这样的。当然智能航线规划、智能起降管理、智能空中防撞等问都在研究中。如以后交通路口不需要红绿灯,只有无人驾驶办得到,有人驾驶就办不到。将来,我们的物流也应该是建立在这样一种系统上去思考。
所以总体来说,信息服务系统再加上人工智能,在这个基础上就可以对未来社会的方方面面进行各种各样的畅想,没有做不到的,就只有想不到的。从信息服务系统来看,人工智能来说有这么几点结论,一是大数据资源的感知、开放、共享、安全、更新是大数据研究的重要方向。二是高动态多模态的大数据存储与分析的一般技术短期内很难有重大突破,但是结合一些具体应用领域需求来展开的大数据技术研究很可能取得重大突破。三是面向大量结构化数据的分析方法有较好的研究基础,同时也有很大的发展空间,在分析人的行为和预测经济社会发展趋势方面仍然发挥重要的作用。四是建立在知识表示与推理机制基础之上,以模拟人的逻辑思维为目标的人工智能技术例如专家系统,在大量数据的支持下一定会得到更加广泛的应用。五是在机器学习理论基础上发展起来的、以模拟人的经验思维为目标的、能够处理高动态多模态大数据的人工智能技术在大数据分析中可能有很好的应用前景。六是建立在大数据和机器学习深度融合基础上的、以不依赖于人类先验知识的自学习为目标,以深学习和强化学习技术为支撑的人工智能具有更为广阔的发展空间。
新一轮科技革命正在引领世界经济的发展,新一代信息技术正在深刻地变革着经济社会的发展方式。然而,社会对人的最基本的素质要求却始终不便。例如,千百年来,诚信被中华民族视为自身的行为规范和道德修养,形成了内容极其丰富的诚信文化,空子道“言而无信,不知其可也”,这是两千五百多年前的古代先哲们对诚信的理解,同仁堂有一副有名的楹联“炮制虽繁必不敢省人工,品味虽贵必不敢减物力”,这是近代的企业家们对诚信的理解。在今天,卫星上天、蛟龙入海,这些丰功伟绩无一不是广大科技工作者扎扎实实诚信劳动的结果。这足以说明,尽管两千五百多年来,科技、经济、社会发生了不能简单用翻天覆地来加以形容的巨大涅变,但是社会对诚信的要求却是亘古不变的。