作者简介:徐占华,重庆市勘测院北碚分院副院长,教授级高工,注册测绘师,注册城乡规划师。主要从事移动测量系统、多源异构时空大数据平台的研发推广工作。参编专著1部,参加国家级行业标准1项,市级行业标准1项编制工作,申报专利10余项,发表论文40余篇,主持和参与多项国家、市级科研项目,获得省部级奖项20余项。
你心中是否也有一个梦,在梦中,山川上林木郁郁葱葱,大地上遍染绿色,天空中湛蓝清新,河湖里鱼翔浅底,草原上牧歌欢唱,这就是我们美丽的家园风光。而沐浴在山清水秀的自然背后,是传感器会实时告诉后台指挥中心河流中是否排放污染物过量?空气的质量变化如何?噪声是否超过限度?并且自动拟定是否提醒警告,还包括如何进行整改的建议等。梦中的蓝图提出两个课题,一个是“山水林田湖草”,另一个是“大数据”。那么我们为什么要关注“山水林田湖草”?什么是大数据?哪些属于大数据?我们能做哪些工作呢?
一、为什么关注“山水林田湖草”?
关注“山水林田湖草”主要有三个方面的原因,一个是唯一性,一个是共生性,最后是管理必要性。
从唯一性角度来说。前段时间热映的电影《流浪地球》中,当太阳出现衰老膨胀时,人类选择的自救方案是带着地球离开,而且霍金老先生也提出“平行宇宙”猜想,希望在地球外找出人类适宜生存的第二星球,但目前人类并没有突破太阳系,解决这个问题的时间遥遥无期。因此,到目前为止,地球仍旧是人类赖以生存的唯一家园,而承载在其上的“山水林田湖草”就是生存发展的基础,具备唯一性,我们必须珍爱和呵护。
共生性是指山水林田湖草共同组成了生态系统,是一个生命共同体。阿尔卑斯山的意大利人,当他们将山北坡的枞树林砍光用尽,居住地山南坡的高山畜牧业根基出现问题,山泉面临枯竭,雨季洪水倾泻入平原。所以,必须尊重自然规律,不顾此失彼,造成系统性破坏。人的命脉在田,田的命脉在水,水的命脉在山,山的命脉在土,土的命脉在树。
最后是管理的必要性。众所周知的笑话,“一只青蛙,在田里的时候,它归农业部门管;跳进水里,就由水务部门管;跑到山上,变成林业部门管;被卖到了菜市场,又成了工商部门管”。在行政管理上“条块分割”是以往的顽疾,2018年3月的《深化党和国家机构改革方案》中明确,成立自然资源部并整合原国家发展和改革委员会、住房和城乡建设部、水利部等相关职责,统筹山水林田湖草系统治理,实行“两个统一”,即统一行使全民所有自然资源资产所有者职责,统一行使所有国土空间用途管制和生态保护修复职责,着力解决自然资源所有者不到位、空间规划重叠等问题。
二、什么是大数据?
大数据被认为是国家基础性战略资源,是21世纪的钻石矿。美国早在2009年就创办了大数据开放平台(https://www.data.gov),内容涵盖农业、气象、金融、就业、人口统计、教育、医疗、交通、能源等大约50个门类的数据,其主要目标是开放美国联邦政府的数据,通过鼓励创新让数据走出政府,得到更多的创新运用。中国在2015年由国务院发布了《促进大数据发展行动纲要》,并在2016年由工业和信息化部发布《大数据产业发展规划(2016-2020》。在2018年机构改革过程中,各地纷纷成立了特色“大数据局”。2019年5月,重庆市人民政府审议通过《重庆市全面推行“云长制”的实施方案》,准备构建一朵市级大云牵手N朵部门云的“大云牵小云”体系,实现区县系统数据“云上”部署。
大数据具备5V特征,即Volume数据量大,Variety种类和来源多样化,Value 数据价值密度相对较低,Velocity数据增长速度、处理速度快,时效性要求高,Veracity 追求数据真实性。那么它能带来哪些思维转变呢?
第一个改变是“要全体不要抽样”。以往做分析时主要局限于抽样数据、局部数据或片面数据,而大数据要求的是真实告诉我们“是什么”,不能在未搜集数据前,先设定一些假设条件,然后进行筛选和分析。让数据还原为本来的样子,找到以前没有意识到的联系存在,更能提高人类的洞察力和价值导向。
第二个改变是“要效率不要精确”。数据的来源不同、格式不同、频率不同,都会给数据带来很多噪声,并且会有一部分“虚假信息”无法被准确发现,因此,要想精确地预测一件事情的趋势在开始阶段会显得“力不从心”,它只是会随着数据资源种类的增多,随机性增加,大幅提高精确度而已。
第三个改变是“要相关不要因果”。正如沃尔玛超市数据显现出,当飓风来临时,手电筒和蛋挞(草莓味)销量增加,具体飓风和手电筒、蛋挞的关系,其实根本不是分析原因的重点。地理上也存在一条“胡焕庸线”,这是最早由“大数据”得到的中国人口地理大发现,但80年过去,人们发现它与“八纵八横”高铁网、物流运输密度、春运迁徙路线、经济分布等都不谋而合,那么,它就可以作为政策制定者、研究人员,甚至投资人和企业家们关注的人文地理分割线,辅助进行产业布局等工作。
三、哪些属于大数据?
关于大数据的表达范畴,我们要厘清“大数据”和“数据大”的区别,大数据并非数据量一定是非常大的,只是由于来源于多种渠道,其格式、体量才会呈现出越来越大的趋势,号称个人数据进入TB时代,社会数据进入EB时代。比如我们对河流的水质数据进行采样,其数据体量无法与历年遥感影像相比,但因为其具备的连续性,也可将该类数据归为大数据范畴。
大数据背景下“山水林田湖草”,描述的是“人地系统空间下的表达”,它要求可以回答何时(When)、何地(Where)、何目标(What object)发生了何种变化(What change),并在正确的时间(Right time)和正确的地点(Right place)把正确的数据、信息、知识(Right data/information/knowledge)推送给需要的人(Right person),实现4W信息实时推送给4R用户的地球空间信息服务的最高标准。从来源分类上讲,可将其划分为基础大数据和智慧大数据两种。
基础大数据是指通过将通信、导航、遥感卫星一体化组网,并搜集整理已有的数据成果融合而成。内容上包括矢量数据(如1:500、1:1000、1:2000等基本比例尺地形图)、影像数据(空间分辨率0.1米以上的航空、卫星遥感数据)、高程模型数据、地理实体数据(包括境界、政区、道路、水系、院落、建筑物和植被等)、自然村以上地名地址数据、三维模型数据以及随技术发展而出现的新型测绘产品数据,如可量测实景影像、全景影像、倾斜摄影测量、激光点云、室内地图、地下空间、建筑信息等。
另外,也包括其它一些社会公共专题数据,如法人、人口、宏观经济、民生兴趣点、地理国情普查和监测等。目前该类数据的难点是在于“更新速度较慢,存储空间大,融合技术尚待进一步提高”,所以,多源成像数据在轨处理技术、海量数据流时空数据采集/动态管理与高效智能处理技术等都是以后需要重点关注方向。重庆市勘测院与重庆数字城市科技有限公司联合研发的“车载移动测量系统”为获取地面可量测实景影像提供了技术方案,并且重庆历时三年已首次实现全市域多源多尺度实景三维模型全覆盖。
智慧大数据是指利用物联网各种传感器自动和实时地采集现实中人和物各种状态和变化信息以及采用网络爬虫等技术通过互联网在线抓取研究目标所缺失的数据。根据预测,到2020年,全球将有7万亿个各种各样的传感器在实时观测、监测、记录、感知地球内部、表面、近地空间的自然和人类活动,平均每人1000个。在全球层面已建立环境、陆地、气候、生态的观测网络,美国建立了包括10个关键带观测站和1个关键带研究网在内的地球关键带观测网络,欧盟建立了4个关键带观测站。其他几个有趣的例子是,可以通过手机信令或通过公交卡刷卡记录与运行路线匹配,获得人员活动的轨迹;可以通过网络抓取到城市道路拥挤程度、市长信箱的居民感知、空气质量监测等。这些数据通过人工智能和数据挖掘等智能手段,处理其中海量和复杂的计算后,能帮助实现对自然资源和人的感知、认知和反馈,为应急、管理、扶贫、规划和大众生活提供各种决策支持服务。
四、能做哪些工作?
大数据的核心在于趋势预测,在获得种类繁多数据的基础上,我们能做哪些工作呢?从数据利用内容上,一种是仅使用基础大数据或智慧大数据进行某一专题预测,另一种是综合获取的两类数据源并最大限度地让其产生联结,分析数据与数据之间相关性,产生新的挖掘成果,将“山水林田湖”与人的活动放在一个综合框架下进行分析。从服务对象上,分为三个方面:
一是服务国土空间规划。新时代的国土空间规划起点为“统一的底图、统一的底数、统一的底线”,终点是“统一的空间方案、统一的用途管制、统一的管理事权”。在区域性宏观规划层面,可利用自然资源调查监测数据进行如京津冀地区20年城市空间格局、生态保护红线划定、交通网络规划、北京非首都功能疏解等研究;从资源数据和环境特征入手,对资源适应性和限制性进行评价,进而进行区域资源环境承载能力和承载压力的评价,从而得出区域国土开发的适宜方向,用于指导规划实施与监测;从区位、社会经济和政策层面进行城市扩展和预测,对当前发展模式下未来城市景观格局特征进行模拟,作为城市发展中景观格局控制的依据;将人空的间行为特征和规律纳入考量体系,研究人口迁移与城镇体系规划、企业投资倾向、市民出行偏好与市政基础设施/公共服务设施布局。在微观规划层面,可进行不同方案的生态、经济和综合效应评估,如不同建筑格局、地形垫面下的微气候影响系数,居住区布局方案和调整方案微气候评估;通过城市街景识别分类,开展景观质量、居民感受评价,获得小尺度景观研究方案。
二是服务生态绩效考核。自然资源资产离任审计是十八届三中全会提出的自然资源资产产权制度,干部任职不再只是以GDP论政绩,而是要考核其所管理的自然资源是否得到保护。综合运用地理信息技术影像分析、抽样检测、实地核查、问卷调查等多种审计方法,尝试建立一个具体的评价体系,使其纳入政府考核体系更具操作性。
三是服务专题监测系统。针对某一专题进行专项研究,解决其关注的核心问题。采用传感器监测水质,研究全球水体的历史模式并对未来的趋势进行预测,建立实现2030议程的可持续发展生态监测系统。利用InSar遥感数据对建筑物进行定期监控,了解建筑物是否垂直变形和倾斜并及时预报警。其它如京津冀地区10余年重点大气颗粒物(PM2.5和PM10)污染源空间分布、海岸带开发利用变化、南水北调中线工程水源地环境动态监测、三峡地区地质环境变化、抚顺矿山地面沉降等。
五、结语
大数据背景下的“山水林田湖草”,是给我们一个上帝的视角,来审视每一寸土地的演化过程,同时,也让我们对周边的万事万物保持好奇,洞察相互关联并尊重自然规律,种树的同时也要兼顾治水、护田,绿水青山终将给我们一片金山银山。