汪林林
重庆人文科技学院计算机工程学院院长,教授。重庆市信息产业咨询专家;重庆市云大协专家顾问委员会委员。发表论文100多篇,SCI/EI收录10多篇,主持省部级科研项目40多项,参与设计、指导、咨询、评审重庆市重大信息化建设项目100多项。
前年我就提出信息化建设三步走的设想,第一步是建设数字共享体系,第二步是建设智能应用体系,第三步是建设智慧城市。今天老生常谈,不对之处请批评指正。
云计算大数据的背景
图灵奖获得者杰姆·格雷曾提出著名“新摩尔定律”,每18个月全球新增信息量是计算机有史以来全部信息量的总和。时至今日,所累积的数据量之大,已经无法用传统的方法和传统的思维方式来处理,因而使“大数据”这个词备受万众瞩目。而处理“大数据”及建立绿色新业态的社会发展需求,造就了“云计算”体系的产生。但我想讲几点看法:
1)当前,云计算的应用已经带来了社会发展的深远影响,它必然彻底改变IT产业的架构和运营生产方式,它不仅是技术革命,更重要的是人类思维方式的革命。理论科学、实验科学和计算科学作为人类发现的三大支柱对应着三大科学思维方式,即:理论思维、实验思维、计算思维。理论思维一一数学科学、实验思维——物理科学,计算思维一一计算科学。在互联网时代,计算思维是人类的现代思维方式,是现代社会对人们思维能力的要求,是人们从事社会各种活动的基本技能。事实上,我们已见证了计算思维对其他科学的深远影响。例如,计算生物学正在改变着生物学家的思维方式;纳米技术正在改变着化学家的思维方式;量子计算正在改变着物理学家的思维方式;我们用计算思维来深思工业4.0时代的发展战略,提出了互联网+,物联网,云计算大数据行动计划,业界各大厂商纷纷制定相应的战略,新的概念、观点、产品不断涌现,正对社会形态和经济形态起着巨大的变革作用。
2)云计算大数据设施的建设是一战略性的举措,要遵循科学、顶层设计、需求驱动、战略布局、讲求实效,防止一哄而起,每个单位、每个部门、每个企业都搞云计算大数据。这恰恰违背了云计算大数据以需求服务驱动,绿色发展的本质。云计算大数据就是要建立一个高效的、安全的、节约的,第三方服务的社会信息商务体系,社会经济架构是服务与购买之间的商务关系。如果我们能像用水、电、气一样,只要把智能终端接入云端中,手控一个智能遥控器,就能享受信息世界的全方位的智能服务,那时,我们就成功了。
3)云计算设施不是物理空间的大集中,要有一个区域性的集中与分布的战略布局。在服务逻辑上是一个全局性的格局,所以从政府层面要组织研究国家性、区域性、行业性、产业性的战略顶层设计,指导建立国家云计算社会架构体系。
4)当然我们必须从战略上认识云计算大数据对社会发展的革命性变革。但在实际信息化过程中它并不是包罗万象的万能灵药。对于非大数据处理,而实时性要求高的智能控制系统、应急处置系统则边缘计算和普适计算更合适。
三步走之设想
十几年里世界社会的髙速发展催生了物联网、云计算、大数据、人工智能技术,反之先进的科学技术对人类社会进步起了巨大的推动作用。在我国大数据战略、智能战略、智慧战略无疑都是大势所趋,势不可挡,但具体实施本人认为有三步要走。
第一步:打通数据绿色通道,构建云数据体系,实现数据共享
2000年在全国人大会上我曾经提出:把信息资源(数据)作为国家的重要基础设施来建设,当时作了“建设数字中国,抢占数字高地”的演讲(在中国青年报上登出)。现在这种认识应该是被人们普遍认知了。近十几年来,国际国内对此都作了有成效的研究,并在应用中发挥了巨大作用。但是如何更加深入去研究大数据的组织体系,使大数据在社会经济发展中产生革命性的作用,却有很长的路要走。我极力倡导《大数据制造》、《创新大数据智慧利用》,可以说,谁占领了大数据高地,谁就将成为行业霸主。
我认为,大数据产业技术研究的几大领域如下:
1)大数据组织体系研究:建立符合应用体系的逻辑一体化的数据组织框架,实现各种数据对象逻辑关联拓扑,为应用层提供逻辑上整体的、髙效的、一致的、安全的数据资源池。(关联结构模型、关联映射模型、概念组织模型-RDBMS,大数据多维数组,大数据数据立方体,大数据数据集市,大数据数据仓库,分析型大数据模型。对应的应用为事务处理、流程再造、统计分析、数据挖掘、智能决策)。
2)大数据模型体系(建模体系):高度形式化是大工业生产的基础。(如P.P.chen的E-R模型,是数据库应用的里程碑)经典的数据库是关系数据库系统,是结构化的。大数据相当一部分半结构化(网页、文件系统)和非结构化的(视频、声音、图像)因此有SQL系统和NoSQL系统(如基于SQL的有ORACLE, SYBASE, SQLServer,DB2;基于 NoSQL的有:GFS,HDFS, Hbase,S3),对此,我想多说说:NOSQL(NoSQL= Not Only SQL),意即“不仅仅是SQL”,是一项全新的数据库革命性运动。 NOSQL的拥护者们提倡运用非关系型的数据存储,相对于铺天盖地的关系型数据库运用,这一概念无疑是一种全新的思维。
随着互联网web2.0网站的兴起,非关系型的数据库成了一个极其热门的新领域,非关系数据库产品的发展非常迅速。而传统的关系数据库在应付web2.0网站,特别是超大规模和高并发的SNS(社交网络服务)类型的web2.0纯动态网站已经显得力不从心,暴露了很多难以克服的问题,例如:
1、 High performance-对数据库高并发读写的需求;
2、 Huge Storage-对海量数据的高效率存储和访问的需求;
3、 High Scalability&High Availability-对数据库的高可扩展性和高可用性的需求。
所以, NoSQL应运而生,NoSQL是非关系型数据存储的广义定义,它打破了长久以来关系型数据库与ACID理论大一统的局面。(ACID,指数据库事务正确执行的四个基本要素的缩写。包含:原子性( Atomicity)、一致性( Consistency)、隔离性( Isolation)、持久性()Durability)。一个支持事务的数据库,必须要具有这四种特性,否则在事务过程当中无法保证数据的正确性,交易过程极可能达不到交易方的要求。
同时,NoSQL数据存储不需要固定的表结构,通常也不存在连接操作。在大数据存取上具备关系型数据库无法比拟的性能优势。当今的应用体系结构需要数据存储在横向伸缩性大的需求,而NoSQL存储就是为了实现这个需求。Google的 BigTable与 Amazon的 Dynamo是非常成功的商业NoSQL实现。
然而对于web2.0网站来说,关系数据库的很多主要特性却往往无用武之地,例如:
1、数据库事务一致性需求(ACID)
2、数据库的写实时性和读实时性需求
3、对复杂的SQL查询,特别是多表关联查询的需求
并且,随着 NoSQL系统在应用中的广泛使用,由于NoSQL系统中抛弃了SQL的优良技术导致了应用开发人员的负担,开发接口千奇百怪,数据不一致,问题状况百出,事务一致性无法保证。
我们都不愿意抛弃前辈科学家经过漫长的拼搏的道路研究出来的而且是为人类社会仍然起着不可估量作用的关系数据库模型,也不舍得让NoSQL受到冷落。从而,现在又提出了 NEWSQL,致力于ACID事务的回归,而且在分布式场景下,致力于实现可扩展、高性能的串行化隔离。
因此,如何将成熟的关系数据模型与非关系数据模型进行整合(特征建模研究)研究岀一种我称之为泛关系数据模型,同时以此研究出高效、可靠、安全、智慧的大数据管理分析系统(只有建立规范的数据模型,以此创立形式化表示的数学理论,充分利用关系理论和AI理论,为研制髙效、可靠、安全、智慧的大数据管理分析系统奠定理论基础和工程化方法,就像 RDBMS走过的成功道路一样)这将是巨大的贡献。
3)大数据可信体系的研究:我们用的数据必须是真实的、可靠的、可信的才有意义,否则大数据就会变成大灾难,是人类毁灭性的大灾难。大数据可靠性、大数据准确性、大数据质量完整性、大数据交易认定性,可喜的事现在全国已经建立了几大数据交易平台。
4)大数据有效体系研究:大数据访问高效性、大数据可扩展伸缩性、大数据的洁净度。
5)大数据的安全体系研究:加解密的高效安全算法、大数据的失效处理机制、灾难恢复机制。
6)大数据生产管理和生产流程研究:为保证大数据生产质量体系的管理和流程、在流程中的关键路径和关键活动所采取的制度体系和技术体系。
7)当然,还有与大数据相关法律和政策、标准规范及运维体系的研究,应该说,大数据制造业兴起之日便是新业态奠基之时,如果我们的政府、我们的企业能够有更多有识之士投身于开拓中国大数据制造业中,这将是中国大幸事,因为,这是信息化建设中最重要最大的基础设施。
第一步就是要实现大数据的产业化,并实现大数据共享的业务应用的极致化。
第二步:从信息化应用向智能化应用推进
基于大数据的基础,使得AI的应用如雨后春笋般的催生。AI正在改变着世界。机器人汽车,语音、图像识别,自主规划与调度,博弈,复杂决策,机器人技术,机器翻译等应用,极大地改变了人们的生活、工作和思维方式,使社会进化到一个更高的信息时代。在此,我要重点强调一点:纵观近代计算机科学发展史,科学家对人工智能的研究一直放在算法上,但基于大数据和极大数据的AI研究表明,如果充分利用大数据而不必太挑剔所用的算法会更有意义,这就是大数据科学工程的魅力。
今天,可以说人工智能无所不能,无处不在。即想即所得 What you want is What you get。这已经不是一句空话了。所以只要敢想敢干敢创新,我们的科硏、企业在这领域可以大显身手,大有作为。如:对于云计算基地运营商就可以实现智能运维的云计算中心(可以构想像供电电网一样的智能运维系统。当然,现在也有一些运维管理产品,但离智能化还有大的差距)。利用AI技术和大数据技术实现云计算中心的智能资源管理,智能资源监控,智能资源调度,智能资源冗灾,智能风险预测,智能应急处置以满足高效、可靠、可控、可管、可用、安全的全方位云计算服务。
第二步就是实现大数据智能应用的全局化,这将对我国社会经济的发展起着引领作用。
第三步:从智能应用向智慧城市发展
智慧城市不是一个纯技术的概念,是对城市发展方向的一种理念是一种发展战略。智慧城市是继数字城市之后信息化城市发展的高级形态,是城市管理和运行体制的一次大变革,意味着城市功能全面实现信息化,更好地促进城市人居环境的改善和可持续发展。智慧城市建设是一个系统工程。在智能城市体系中,要实现的要素主要为:1.城市管理智能化(政府行使经济调节、市场监管、社会管理和公共服务等职能的过程中,为其提供决策依据,使其更好的面对挑战,创造一个和谐的横式生活环境,促进城市的健康发展);2.城市基础设施智能化(包括智能交通、智能电力、智能建筑、智能环境、智能安全等);3.社会福利智能化(也包括智能医疗、智能家庭、智能教育等);4.金融商贸智能化(包括智能企业、智能银行、智能商店等);5.生产智化(包括现代企业),从而全面提升城市生产、管理、运行的现代化水平,极大提高人民的生活水平和幸福指数。
欧盟在对中小城市开展的智慧城市评价中,梳理了智慧经济、智慧公众、智慧管理、智慧移动性、智慧环境、智慧生活6大维度31个方面74项指标,体现了智慧城市建设中以人为本、强化服务、强化价值创造的创新2.0理念。
近几年,国家鼓励开展应用模式创新,推进智慧城市建设。中国深圳市、昆明市、宁波市等多个城市与IBM签署战略合作协议,迈出了打造智慧城市的第一步。北京市拟在完成“数字北京”目标后发布“智能北京行动纲要”,上海市将智慧城市建设纳入“十二五”发展规划。此外,佛山市、武汉市、重庆市、成都市等都已纷纷启动“智慧城市”战略,相关规划、项目和活动渐次推岀。国内优秀的智慧产业企业愈来愈重视对智慧城市的研究,特别是对智慧城市发展环境和趋势变化的深入研究。正因为如此,一大批国内优秀的智慧产业企业迅速崛。
我们要承认,由于我国城市化起步较晚、基础较弱,在当期我国经济社会转型升级的关键时期,智慧城市作为一个全新的系统工程,其建设发展将面临诸多挑战。事实上,经过3年的探索实践,我国智慧城市建设在体制机制、理念与应用创新、建设运营模式、核心资源开发、人才及管理架构、信息安全及标准规范体系等6大领域仍存在比较突岀的问题,能否尽快解决这些问题将直接影响到智慧城市的健康发展。
所以我们在建设中1.要注重基础积累(第一步和第二步的过程积累即全面透彻的数据、宽带泛在的互联、智能融合的应用以及以人为本的可持续创新)。2.要试点为范,一点带面,逐步推广(防止一哄而起,我看到的实例为戒)。3.要根据条件和地方经济发展需求,以需求驱动而不是以概念驱动,有序推进(先进发达地区可先行、前行。各地不必攀比,追新)。4.要明确目标(如:欧盟6大维度31个方面74项指标,当然一定要根据我国的国情和各地的舆情来考虑),逐步实施,落到实处,需见成效(脱离社会发展需求的盲建设不但不能给人民带来髙幸福指数,反而会带来负担一不能去建烂尾楼工程)。
从计算机,到互联网,再到人工智能,短短几十年光景,人类社会颠覆性进化,所有的变化都在以一种肉眼可观却又无法捕捉的状态悄然发生着。
1995年,凯文·凯利《失控》横空出世,对20年后的预测,正在一步步实现—一云计算、人工智能、虚拟现实、算法,这些科幻色彩的词汇正走向大众日常。科技改变了人类的生活,而科技将会带来怎样的未来,尤瓦尔·赫拉利将这些思考写进了《未来简史》。尤瓦尔·赫拉利在《未来简史》中以另类的视角审视人类未来的终极命运,表达出惊人的预测:"人工智能和生物基因技术正在重塑世界,人类正面临全新的议题。生命本身就是不断处理数据的过程,生物本身就是算法;计算机和大数据,将比我们自己更了解自己。
智慧城市已经起步,虽然什么是智慧城市还没有定论,但我们总可以从初步做起,制定一个十年的近期目标,几十年的中期目标,至于长远目标是什么,到底多长谁也不清楚,《未来简史》只是一种设想,不必在意。
从我做起,从现在做起,这为我们有志于为国家智慧城市建设贡献聚力的企业提供了无限的发展机遇。