2017年 6月13日,由泰伯网主办、主题为“空间大数据的崛起”的WGDC2017,在北京国家会议中心盛大开幕。大会由空间信息产业创新创业服务平台泰伯主办,秉承不断引领和促进空间信息技术创新与变革的宗旨,WGDC已走过六个年头,如今成为全球最具前瞻性的跨界创新风向标。
北京市信息资源管理中心副主任穆勇
14日,智慧城市峰会开幕。峰会上,北京市信息资源管理中心副主任穆勇发表了以“政务大数据应用探索与实践”为题的精彩演讲。以下为演讲实录(未经本人核实):
很高兴跟大家一起交流政务大数据方面的探索。主要交流的内容有三个方面,首先政务大数据,第二应用的基础,第三应用案例。说起大数据,不管是定义还是内涵都非常熟悉了,我这里面有一个观点,如果要考虑大数据问题,需要全面的考虑,这个全面就是要从三个方面考虑。第一个是思维方式的变化,另外在做大数据应用的时候他的技术体系发生了很大的变化,还有就是我们的数据对象,也和以前有着很多的不同。这几个方面来看,我们看一下什么是政务大数据。从来源来看,我们可以把政府的数据分成三类,前两类大家可以知道,很多都是我们以前一直在做的工作,特别是对于第三类来说由于的技术的成熟和手段、工具、成本降低,使得现在第三类的数据应用是越来越广泛了,这样对于目前来说我们数据对象的特点,对于政务领域来说我们特点发出了一些变化,这样我们给了一个更大的含义,就是这三类含义我们进行政府大数据。需要谈一个重要的问题就是云计算。
云计算为政务大数据应用提供了很好的技术手段,更重要的是有商业模式。首先是思维方式的变化。原来政府做了很多政务应用都是自己负责采集数据,建设系统更新运维,我们在互联网思维,在新的观念下,可能我们很多变化,我们可能更多是把我们的数据开放出去,特别是一些面向政务服务开放出去,让企业开展这项工作。这是一个很大的变化,原来我们很多自己做的事情,我们可以交给社会和企业来做。
大数据的应用涉及到很多的领域,可能对于政务领域来说大家比较熟悉的,也是比较多的就是领导决策的方面。但是要做好领导决策这项工作,光说我们有了数据做了决策知识系统远不够,还需要领导基层有数据决策思维方式,真正用数据说话,让公众参与决策的过程,有这种思维政务大数据不一定在领导决策方面的应用,有可能获得成功。另外,我们现在的工作和以前工作可能有一些不同,原来更多用一些自己产业了报表数据做一些分析,现在我们可能有更多其他方面的数据,就是互联网数据,物联网的数据,这些数据结合在一起,形成我们的精细化管理。还有一些博士做不了的工作,我们做的更精细了。
现在北京市政府机关包括行政机关,我们正在建设政务云,关于这个机房迁移到政务云上面,政务云更多采用购买服务方式,我们提供机房以及环境,招一些运维商来搭建这个云机房,提供这些产品。政府相关部门根据你使用的资源情况进行付费,这里面不光硬件设施、机房网络以及存储的硬件设施,包括以后的这些平台、PAAS、SAAS的软件,很多都会采用购买服务的方式,我们今年很多招保项目,原来我们系统不建了,我们就是购买这种软件的服务,这是一个很重要的转变。这个过程中很多企业为了构建自己的平台以及他的生态链,很多小的企业可能有一个很小的软件,一个系统如果能够放在政务云里面,那么政府根据使用的情况,或者说跟运营商谈成一个协议,把这个应用放到整个政务云环节中,根据他们这个协议进行利润分成,以后这个云的平台加大了这个开发者的生态,形成了一种新的政务大数据应用的平台以及环境,我觉得这是一个非常本质性的变化。这和我们以前从头到底委办所有系统,从上到下都是自己进行开发完全不一样的,可能他要做的是很少的一部分,很多的部分都是通过我们购买服务方式来实施的。
同时政府部门的系统在2019年之前,搬到通州之后这个系统除了个别的以外,所有的系统都要逐步迁到政务云上,当然迁到政务云上也有一些过程,现在是第一阶段,第二阶段是一些系统在存储、计算、机房网络这一块系统的一些。后续更多的会走到第三层,不光是存储实施,PAAS层的应用,逐步要成为统用的软件和平台。政务应用的转型,为大量创新创业的,这些小的企业提供了一个很好的生态环境。原来很多生态环境是依附于某一个大的企业,阿里或者说腾讯、百度他们有自己的开放平台,但是我们这个在政务云上,这些应用对一些小的创新企业的企业提供了很好机会。
关于政府大系统应用,我们不得不考虑大数据的发展趋势,这个大数据的成熟度曲线,大数据应用通过前两年的操作,已经逐步回归了,逐步走向成熟,很快就要跌入低谷。这么一个大规模的应用,包括大数据的应用,并不是一蹴而就,应该有一个发展一个成熟的过程中,这个过程中应该有甚么样的位置要有清醒的认识,以前炒作得多,但是慢慢走向实用。
大数据应用以及人工智能,人工智能的应用不怕大数据,是以大数据作为支撑,同时跟智慧城市也是密切相关的,不是单一的技术,是多种技术融合的处理,形成一个统一化的智能应用,同时大数据也是对于我们的经济有着重要的支撑,特别共享经济的支撑的。前段时间马云讲了一段话,大数据发展到一定程度能够预测和进行市场的计划,以后计划经济会逐步的取代市场经济,这一说法虽然有一些夸大,但是实际上也是有很多的道理。如果我们不从别的角度来看,大数据是对后续的经济的支撑,发挥的作用越来越大。
这是我们对大数据以及运用的初步展望,看一下政务领域如何做大数据的应用。这样离不开我们政府的业务逐步化转型,目前政府信息化的阶段,第一个阶段要熟悉上网工程,就是电子政务。第二个平台建设阶段,更多是一站式政府,或者说自己做自己的业务,建设一些平台,实现它的一站式服务。现在我们目前的阶段来说,我们认为到了互联网+政务的阶段。第三个阶段是互联网+政务的阶段,这个阶段有两个特点,以强调公共服务为核心的电子政务的业务的一体化应用体系建立,以政务共享开放为核心大数据资源体系框架基本建成,大数据应用成效显著。互联网+政务第一条就是把原来部门政府,变成不管从表面还是内部深层次一体化的整合。电子政务真正发展到了,或者政府信息化真正发展到时候了以信息资源开发利用为核心的阶段。
我们有很多新的技术,新的手段,物联网,云计算,人工智能等等新的东西。我们落地一看,现在政府信息化到底是什么样的情况?在这个情况下,要仔细看的话会发现,真正各级政府的信息化我们更多向一些在井底或者在地下,这些大数据、云计算非常高大上的东西。但是你在这个领域做好这项工作,开展这项工作的话还要实际开展一些工作,我们把这部分的工作叫做大数据应用的基础性的工作,如果没有这些方面的工作,不可能所有基础推翻,然后重新建一些新的系统。从我们现在有了基础怎么样做好大数据应用或者做好平台,可能需要解决很多方面的问题。比如说第一个方面的问题,就是要解决基础数据的问题。政府有很多的数据,如果你自己的数据准确性、质量、使用都不解决的话,在谈什么大数据的使用,我认为都只是口号。对政府来说,第一部分要把自己内部的政府核心数据做好,这是什么问题?要有顶层设计的方法,还要有一些实实在在的方法,把我们已有的数据梳理清楚,把我们的数据标准化,把我们的系统能够实现互联互通。主要解决三个方面的问题,一个是数据资源的管理问题,这个数据谁负责采集,哪些单位能够使用,能不能公开,能不能共享,这些叫做数据资源的管理。二个是解决数据资源的可用性,这些数据采集过来了,拿过来共享了,拿过来这个数据的质量不能使用也不行。三个基于现有的平台,现有的设施,实现他们共享的使用。我们认为这部分的工作是非常重要的。
业务梳理与目录编制工作,这些方面工作第一离不开领导的支持,第二业务的参与。第三,信息化的手段。
对于已建的系统进行清理,前期国务院办公厅发了一个新的文件,对现有的信息系统进行调整的实施方案,就是提出了已建系统如何进行审计、清理,实现他们有效的使用。这一块有一套专门对已建系统如何进行审计处理的清理的方法,多年前总结出来的方法。还有要解决第二方面的问题,就是数据的标准化,提高可用性的质量。推动政府数据共享,以前是共享交换,同时政府的大数据应用也好,还是服务也好,以后很多工作我们要有新的思维方式,通过开放数据,开放政府的业务,服务能力,让社会做,让企业来做。这样的话,我们有更多采用做一些服务,发挥一些大家的智慧。这是我们的一些数据开发网站的平台。
这个平台有两种方式向社会开放,一种是所有人都可以注册使用,这是一类的。可以提供下载接口,还有一类叫做有限的开放。20多家三甲亿元的数据,各种公开数据面向医学会会员,还有面向大学生创意比赛开放,有这样一些方案。通过这些方案可以看到政务的开放可以带来设施很多好处。首先政府有很多的应用,从他的方案设计等等,很快就会征集到100多个或者数百个应用方案,有一批很好的应用就可以上线,有一些是公益,有一些是消费的,可以拉动消费产业,支撑创新创业最好的一种方式。基于政务云,对政务大数据体系进行了设计,这个设计我们知道政府的不管是大数据应用也好,一定是综合的,或者说多技术融合的体系,也考虑几个方面的原则,大平台的应用是非常小的,大多数应用一些通用土地,整个体系是一个混搭的模式,既考虑到我们传统的模式,还考虑到新的数据架构使用,而且是支撑庞大的。一个大数据的应用,它的特点不一样,它所用到的东西、组建、结构都是不一样的。不同的应用有不同的结构。比如说这个结构用到它的存储、计算、架构的模式。另外一个应用,可能会有一些其他的,但是我们会把这些通用的东西给它做出来。这是政府通用的大数据架构。
这里有PAAS以及SAAS的应用和底层的。还有服务架构。我们觉得我们这个数据架构和以前有着很大的不同,原来地方政府都一直在提政府数据逻辑集中物理分散,但是对于我们来说,它的特点跟其他地方不一样,不一样为什么,为什么改革物理集中,我们建了物理云所有机房都是统一的打击房,它的设备,它的系统它的数据都要物理集中在一栋楼里面,或者几栋楼里面。为什么是分散,每一个数据的这个产权,这个主权以及责任,是谁的谁拿回去。在云的环境下,这个技术体系包括数据在内,以及他的安全体系,这些数据可能有一些工作会有统一的组织开发商来做,可能这个环境云语音服务商来做,还有一些弓形华的,有这些需求可能所有创新创业的企业都可以设计,如果设计好的话这个应用体系是一个伸缩以及弹性,而且是一个动态调整的过程。不是我们自己开发,下面分享几个案例。一这个数据中心建完以后也是庞大数据集中在一起使用传统架构,开展一些大数据的分析以及应用,在系统操作的时候急需扩大,有一些实时的数据进来之后,整个体系运行速度非常慢,觉得你这个大数据应用非常好,一个方面的简单应用被我们整个北京市节省十亿元,但是有一个什么问题,运行起来速度太慢。市长说你这个东西是很好,但是太慢了。
基于大数据环境下新的架构,原来使用这个非常好现在都是使用X86的。这这么大规模的应用,如果使用了新的数据,还使用老思维以及老技术的话,已经难以为继了,需要转变。利用大数据应用脱离了政务云,新的架构,新的思维,可能都谈不上真正大数据应用。对整个汽车行业使用一些传统数据之外,采用微博微信,互联网上的应用进行印证。像这些方面工作都是使用互联网的来获取的。我们在做大规模应用一定是两者结合在一起,有一些方面互联网应用用其他来做,其他方面比如说传统预测分析,还是基于现有的统计数,是权威发布的。这是它的预测,到了几方面的数据。
我的汇报就是这样。谢谢大家。