编者按:近两年,被称为“21世纪石油”的大数据成为热点话题,并已在生产生活和科研等诸多领域发挥作用,受到发达国家的普遍重视。反观我国大数据产业的发展现状,由于各种行政因素和市场因素,存在数据打通难、数据开放严重不足、数据话语权堪忧等问题。为揭示大数据产业发展受阻背后原因,并提出具有针对性的意见和建议,本报即日起推出“大数据:垄断与割裂”系列报道,敬请关注。
横亘在大数据版图上的一道道部门壁垒,让大数据企业步履维艰。
百度地图是目前广泛使用的电子地图,但由于政府的地图资料信息不公开,企业只能被迫自己采集信息进行标注。
“地图上的公交服务信息应由政府免费提供,但实际上这些信息都没有公开,我们只能挨个跟公交公司谈,不仅资源浪费严重,而且效率非常低下。”百度发展研究中心副主任黄林莉说,政府层面的信息公开距离企业实际需求差得很远。
《经济参考报》记者近日在北京、天津、浙江、贵州等地采访发现,政府运用大数据助力政府治理正进入数据积累和分析的初级阶段,但由于动力不足,部门壁垒森严,存在数据打通难、数据开放严重不足等问题。业内人士呼吁加速公共数据资源的开放,为大数据产业进一步纵深发展营造健康环境。
公共数据垄断加重企业负担
随着大数据浪潮风起云涌,一些政府部门和垄断机构掌握的丰富数据资源成为香饽饽和聚宝盆。然而,大数据企业很难获得这些公共数据,企业日常运营中信息审核成本巨大。
“如果政府掌握的个人征信大数据库对企业和社会开放,将意义重大。”国内大型生活分类信息网站、58同城政府事务部总监曲子恒对《经济参考报》记者说,58同城有5500多名员工,其中3000多名销售人员的主要任务就是审核用户信息。由于诚信机制不足,对于用户信息了解程度有限,销售人员必须耗费大量精力接触商户以保证安全,比如开锁公司、搬家公司在公司网站上发帖,销售人员就要上门进行人工审核。
曲子恒说,目前查询身份信息,每验证一个身份证要交3元钱,增加了企业审核成本;查询企业信息,登录北京工商局网站可以获得一些企业的基本信息,但很多地方信息仍然不公开,不拿着律师证跑到当地工商局大厅就查不到,而且查询还要收费。如果工商注册、身份证查询的大数据系统对企业和社会开放,一些信用记录不良的人一旦发帖,网站就可以根据记录获得风险提示,从而告知商户谨慎交易,企业也不需要花费这么多人力和时间上门验证,能够节省巨大成本。
大数据管理解决方案提供商、龙信数据(北京)有限公司研究中心副主任祁鸣说,政府大数据应用的理念亟待创新,大数据不是人民币,在缺乏挖掘能力的人手里一点用处都没有,但在具有行业经验的人眼里就是一份宝藏。
开放公共数据,既可以提升政府治理能力、推动政务公开,也可以方便百姓生活。腾讯互联网与社会研究院副秘书长谭涛说:“政府开放数据就像向小河注水,会保持河流生态的健康,开放后能带动数据挖掘分析产业的蓬勃发展。现在百度、阿里巴巴、腾讯等大型互联网企业搜集的数据再大也有片面性,如果能与政府数据进行交叉验证,前景将无限光明。”
“现在的问题在于,政府没有动力深入挖掘大数据的价值,而企业又拿不到有用的大数据。”祁鸣说,在我国,一些政府部门拿到其他部门的数据后不对社会开放,先在政府内部共融共通,但事实是政府内部的信息共享都无法实现,更别提对社会和企业开放了。
数据杂乱“放开了也拿不走”
目前数据开放共享主要面临三个方面的问题:一是数据条块分割严重,服务推行困难;二是数据平台缺乏统一标准,“一个部门一个样,放开了也拿不走”;三是一些数据资源丰富的部门不愿共享。
在采访中,多家企业负责人向《经济参考报》记者反映,即使拿到公共大数据,但由于政府部门条线分割严重、缺乏数据存储规范标准,这些数据十分杂乱,分析并加以利用的成本很高。
“很多记录下来的数据没有规范化,也没有对数据存储进行设计,即使在同一个行业,数据也是‘一人一个模样’。”百度大数据部副总裁陶海亮说,存储语言不一样很难融会贯通。例如医疗行业很多信息系统厂商记录下来的数据根本没有统一标准,要想合作,必须先弄清数据含义是什么,这样做成本很高。
对此,龙信数据(北京)有限公司董事长兼总裁李钰说:“拥有者不一定觉得有用,看得懂、用得着的不一定能拥有。政府开放数据需要勇气和决心,并落实到行动上。”
记者调查发现,目前,公共数据条块分割严重,干扰数据汇聚。杭州市经济和信息化委员会副主任杨福颂说,杭州有20多个归属不同部门的信息中心,这些信息中心人为地形成一个个互不连通的“信息孤岛”。天津开发区城市管理局数字城管科科长陈松说,天津政府部门的社区公益服务已在技术上实现了突破,通过智能手机和客户端几乎可以实现零成本的公益活动,但综合管理体系需要工商、税务、社区服务部门的联合,难度较大。
同时,各系统数据标准不统一,开放共享成本大。宁波市智慧城市建设协调处处长聂聪迪说,政府大数据目前没有统一标准,地方和各个系统都在制定自己的数据标准。“地方区域有块上的标准,卫生系统等有条上的标准,条块标准遇到一起需要数据共享,再修改标准将耗费巨大成本”。
此外,部门利益至上,制约大数据开放与应用。天津开发区华纳社区是中央政法委“全国综治信息系统”试点单位,目前全区的残疾人、吸毒人员、重点关爱人群、独生子女等的数据均实现共享,但诸如流动人口、房管信息等数据较难获得。
武汉市信息产业办公室主任黄长清说,武汉市政府机构网站可归为520个数据集,数量已超北京、上海公布的数量,但有些数据资源丰富的单位公开和共享动力不足,给跨行业数据汇聚整合造成困难。
政府公开数据须算经济账
专家认为,开放大数据的作用就像当年实行的“耕者有其田”,这将是生产关系的一次大变革,会促进生产力的大解放。
“作为公共财产的政府数据,本质上属于人民,应该在保障国家安全、个人隐私和企业商业秘密的前提下,让这些数据回到人民群众中去。”中国工程院院士、中国计算机学会大数据专家委员会主任李国杰说。
《经济参考报》记者了解到,美国、英国、日本等发达国家在发展大数据产业之初,便不遗余力地开放公共大数据。美国数据开放网站目前已有超过37万个数据集、1200多个数据工具,这些数据来自170多个机构。英国政府专门建立“数据英国”网站,已将政府开支、政府部门财务报告等数据公开。
李国杰认为,政府应当公开的数据主要分为三类:一是操作业务信息,主要指政府各部门间办公流程所需的数据,如办理银行贷款时所需查询的信用数据等;二是管理信息,主要面向各类业务的管理者;三是研究和决策信息,主要面向政策研究人员、企业管理人员等,主要从数据中发现新规律、新问题,进而制定新政策。
李国杰还提出,政府公开共享大数据,不是单纯登记政府现有数据,而应以公众需求为导向,以促进国家治理变革为目的。同时,要算经济账,不是越多越好,而要能带来信息化成本的节约。英国政府通过高效运用大数据技术,每年约节省政府支出330亿英镑。
提升大数据治理“有所为有所不为”
业内人士建议,在开放公共数据方面,处理好“政府的手”和“市场的手”可以事半功倍。
金蝶国际软件集团有限公司高级副总裁张良杰说,政府开放数据相当于铺路修桥,方便所有人的通行,但不能借此插手大数据企业的经营。政府需要做的是增值服务,比如建设大数据运营服务中心,帮助企业进行人才培训等,其他的则可以放手让企业去做,推动大数据良性生态链的建设,自然形成集聚效应。
李钰说,政府在应用大数据提升治理能力方面要“有所为有所不为”,没必要什么事情都由政府做,可以通过购买服务等形式培育相关产业,发展专业服务。例如,可以推动产学研结合,委托企业、院校研究一些重要课题,围绕着政府公开的大数据做出有意义的成果。考虑制定合理的产业振兴政策,对拥有核心技术和应用方案的企业给予鼓励等。
针对政府各部门和企业普遍反映的政府数据共享和开放问题,《经济参考报》记者在多地采访发现,一些地方政府已经出台法律法规,明确共享边界。杭州市经济和信息化委员会副主任杨福颂认为,数据共享不是无条件的,数据开放共享不应由某个部门说了算,而是由多个部门组成的专门机构调研决定。为打破部门利益藩篱,《杭州市政务数据共享开放指导意见》明确提出,原则上部门不能以涉密为由拒绝数据共享和业务协同,各部门数据是否涉密,由市信息化办提请保密部门予以确认。
一些地方狠抓数据质量,整合信息孤岛。数据质量参差不齐是很多地方政府整合数据时遭遇的突出问题。对此,河南省2009年开展“企业登记数据核查清理”专项行动,对164万户企业、684万卷档案、1.5亿项数据进行补录和更新,建设了统一的大数据库。2010年以来,又核查251.9万户市场主体,清理309.7万卷书式纸质档案,核对1305.5万个数据项。
有些地方新增了数据统一标准。宁波市智慧城市建设协调处处长聂聪迪说,宁波新的体系建设都要求按照新标准进行,旧标准数据能够云化就云化,在协调统一试点个案的同时,注重标准的研究设立。
对于数据开放共享的推进监督,九三学社中央科技委员邬玉良建议,将政府部门间的信息共享纳入绩效考核,建立数据质量评估机制;加强政府与大数据企业的沟通,设计数据采集标准、数据更新频率等;鼓励对政府公开数据的分析应用,吸引相关企业从开放数据中挖掘更多有价值的信息。
(本版稿件除署名外,均由记者孙洪磊、南婷、韦慧、李惊亚、马意翀采写)