国际标准刊号:ISSN1672-9544  国内统一刊号:CN21-1520/F  邮发代号:8-166  投稿邮箱:dfczyj@vip.163.com
首  页  |  特别关注  |  专题策划  |  理论前沿  |  体制改革  |  财政管理  |  税收天地
县乡财政  |  三农聚焦  |  工作研究  |  财务会计  |  海外传真  |  史海钩沉  |  资讯速递
您现在的位置: 地方财政研究 > 正文信息

刘文卿/新时代对财政大数据应用的思考

日期:2018/1/2 17:43:26 来源:地方财政研究2017年12期 阅读次数:606

财政部国库司

 

内容提要:财政部门历来具有数据应用的天然禀赋,开展大数据应用更是新时代的必然选择。本文把引入大数据应用视为财政部门新的生产力,从发挥财政是国家治理的基础和重要支柱作用的视角切入,对财政系统普遍存在的数据不够集中、数据不够细化、数据外延不够宽等现实问题进行了分析,并结合财政部门正在开展的国库集中支付电子化管理、非税收入收缴电子化管理等实际工作,针对如何规划财政数据资源和相应信息系统,提出了开展大数据应用的具体思路。

关键词:国家治理  大数据应用  数据规划  现实问题

 

在互联网时代,大数据是了解社情民意的“顺风耳”,是明察政策实施效果的“千里眼”,是科学决策、精准施政的“最强大脑”, “用数据说话、用数据决策、用数据管理、用数据创新”是这个时代各行各业进行管理和创新的新手段。财政部门自诞生以来就具有“数字说话”的基因,数据应用是财政部门“天赋秉性”,数据应用的水平决定了财政部门的管理方式和管理水平,甚至是职能定位。财政部门开展大数据应用是新时代的必然选择。

一、财政大数据的特点和意义

(一)财政大数据的特点

一般来说,大数据具有四个特征,即四个“V”:一是Volume(容量),指数据体量巨大,一般都是PB以上级别;二是Variety(种类),指数据类型繁多,比如视频、文本等异构化的数据混杂在一起。三是Value(价值),指价值密度低,以视频为例,连续不间断的监控记录,可能有用的数据只有一两秒。四是Velocity(实时),指处理速度快,比如推荐最佳导航路线,需要在极短的时间计算出结果,否则就失去了应用的价值。财政大数据并不完全适用以上四个特征,其具有三个独特之处:一是结构简单。通过数据规划,财政只需处理结构化的数据就能够满足需要。二是价值高。数据处理结果往往直接对应着“真金白银”。三是延伸性强。数据的背后,往往关联着政府管理和社会经济活动。因此,财政大数据不同于公安、医疗等部门的大数据应用,建设起来相对容易,投入产出比高,作用广泛,能够为政府其他部门、社会团体提供决策支持,甚至直接带来经济效益。

(二)开展财政大数据应用的必要性

党的十八届三中全会提出“财政是国家治理的基础和重要支柱,科学的财税体制是优化资源配置、维护市场统一、促进社会公平、实现国家长治久安的制度保障”,这是在国家治理现代化视域下,党和国家对财政的一个全新定位。党的十九大要求加快建立现代财政制度和全面实施绩效管理,对财政提出了更明确和具体的要求。在新时代,围绕财政是国家治理的基础和重要支柱的这一重要作用,探索和推进财政制度创新和实践创新,建设与大国治理要求相适应的财政体系和财政能力,靠传统方式方法显然不能满足需要,引入新的“生产力”是必然选择。机器生产代表着工业时代的生产力,而大数据应用则是互联网时代的生产力。马克思主义基本理论告诉我们,生产力是社会生产中最活跃、最革命的因素,是社会历史发展的最终决定力量,它决定着生产方式和生产关系。开展财政大数据应用,就是要把新的生产力引入财政部门。一是促使财政职能和作用延伸。财政资金的收支活动可以涵盖所有政府部门、企事业单位,乃至所有社会团体和个人。因此,财政数据能够包含政府、企事业单位的业务运行情况,能够关联国计民生方方面面,能够反映出资金使用背后的机构和个人行为。通过大数据应用,让财政数据会“说话”,能讲“故事”,既能发挥在国家改革发展的重大方向、重大原则和重大决策上的智库作用,又能发挥政府在提供公共服务,满足百姓对美好生活需求上的主动性和有效性。二是促进财政工作方式转变。大数据应用,就是让那些使决策者的个人精力和脑力无法处理的浩瀚信息,以合适的方式,在需要的时候,能够关联、推理、评价、测算、决策、执行的过程。这个过程即数据驱动的过程,具体到财政业务来说,编制预算、审批项目、确定补贴、集中支付等等,既要依托相互关联的数据进行科学决策和精准计算,又要为后续的数据应用收集数据和生产数据。开展大数据应用,必然使数据成为财政政策制定、业务流程设计的基础,业务人员的工作方式必然也要进行相应的调整。

二、财政开展大数据应用的现实问题

财政部门是数据密集型的综合管理部门,长期和数据打交道,数据和信息一直以来都是财政工作的根本和基础。但从全国来看,财政大数据应用进展相对缓慢,与领导重视程度和工作的迫切需要不相对应。“巧妇难为无米之炊”,难以获得有效数据是制约财政大数据应用的根本问题,主要体现为:

(一)数据不够集中

数据难以集中是财政系统的普遍现象,主要表现在财政数据分散存储在各个应用系统之中,业务标准不统一,数据结构不统一,大量的数据无法直接共享。从目前来看,广大财政职工数据共享意识不断增强,都迫切希望获得更多维度和广度的数据,一线业务人员已经成为促进信息集中的最积极最主动的力量。但为什么财政的数据这么难以集中呢?笼统的说,一是技术实现难度大,二是没有机构支撑,归根到底没有专门的机构来建设和管理集中起来的数据。具体来说,把数据集中起来的基础条件,就是要把各个系统中相同的业务要素标准化、数据结构一致化,这项工作工程量巨大,需要有专门的机构持续推进才能体现出实际效果。其次,传统数据是面向应用(Application Oriented)的,它的构成只需考虑具体应用即可。集中后的数据是面向对象主题(Subject Oriented)的,面向对象主题的数据组织方式,需要在较高层次上统一地刻划各个分析对象所涉及的各项数据以及数据之间的联系,为综合业务应用和决策提供支撑。这样,在数据集中过程中,数据的存在形式发生了本质的变化。新数据的形式需要专职人员事先规划和后续管理,这样才能供各方有效利用。另外,把数据集中到一起后,它就成为一项重要的资产,对这些资源进行有效管理、有序使用显然是一项重要职能,也有必要设立专门机构进行管理。

(二)数据不够细化

业务部门的同志常常会遇到领导要几张报表,因为系统无法提供,只好让各个单位人工上报数据,既费时费力,也可能不准确,结果有些部门还嘲笑财政是“守着数据金山的乞丐”。表面上看,是因为系统中的数据还不够细化,不能按照需要生成各类报表。更深层级上讲,是因为很多系统中只有记录结果数据,而没有过程数据,造成细节的缺失。这种情况与业务人员的传统思维和工作方式有关。需要什么数,就收集什么数,不关注过程,这是传统报表思维。比如,学生用饭票用餐和刷卡用餐是有本质区别的。如果学生到食堂就餐使用的是饭票,那么学校最多能知道某个学生买了多少钱的饭票。如果让学生刷卡用餐,那么学校每天得到的数据,就足以让你知道,某个学生消费了多少,去的哪个食堂,什么时候去的,买了哪些菜?这个例子,说明工作方式对数据明细程度的决定作用。可以这样认为,我们的数据不够明细,是因为我们有些工作方式还在“卖饭票”,像卖饭票的老大妈一样,永远不知道买票背后还有多少精彩故事。

(三)数据外延不够宽

财政数据分析仅仅关注预算、执行等具体问题还不够,一定要有更宏观的视野,才能与财政职能相对应。因此,财政数据要融通财、税、经济、社会等多维信息,只有这样才能建立起相对完善的数据集市或仓库,才有更好的发挥财政在经济范畴和政治范畴的双重作用。具体来说,就是要将财政部门的数据,包括财政收支、政府采购、行政事业决算、预算绩效、政府资产负债等数据信息与海关、审计、统计、社保、卫生、教育、人口、司法等部门的有机关联,合理共享。目前,许多财政部门的数据都还难以做到共享互联,更不用说和其他部门的数据信息共享,这也制约了财政数据应用的深度和广度。实际上,财政获取其他部门的数据具有天然的优势。一种方式是与相关部门谈判,进行数据交换,建立合作共赢的一种共享机制。更重要、更具有普遍意义的方式是转变工作方式,在项目审批、预算执行中自动获得数据。比如,非税收入收缴工作包络社会万象,财政只要统一了收缴渠道,收缴部门什么时候收的钱,收了什么钱,这些收缴的背后关联等什么行为,有什么政府管理和社会管理意义,财政就一清二楚。再比如,如果我们能够比照阿里巴巴,建立一个全国统一的政府采购平台,那么何愁财政数据外延性不够,财政部门利用大数据出台CPIPMI指数也不是什么难事。

三、如何开展财政大数据应用。

财政数据结构简单、价值高、外延性强的特点,决定了财政大数据应用与社会上其他大数据应用相比,门槛较低,易于实现。比如,判断低保补助是否合理,如果有低保对象的个人所得税记录、个人房产记录等外部关联数据,一个报表就足以解决这个问题。因此,开展财政大数据应用更需要加减乘除和对比,构建复杂的模型分析尚在其次,解决了数据规划问题,就解决了财政大数据应用问题。

(一)建立体制保障

大数据应用是一项全局性的系统工程,没有体制保障难以达到预期效果。

首先,要指定或建立专职机构负责数据统筹、业务协调、日常管理等工作。考虑到增加编制的复杂性,初期完全可以把这项职能赋予综合性的预算执行管理部门,这类部门是财政数据的聚集地,关联着财政内部各个单位、财政外部广大预算单位,甚至社会团体和个人,既便于开展数据收集,也利于旧有数据的整合工作。

其次,要建立相应的标准化体系。长期以来,解决“信息孤岛”问题有一个传统的认识误区,即很多人期望通过做数据“接口”消除信息孤岛。美国著名的数据管理专家威廉.德雷尔(William Durell)有个著名论断,如果有N个孤立的数据,若依靠接口互连,则需要N×(N-1)个接口,这在操作层面是不现实的,解决的办法只有数据标准化。对财政来说,数据标准化主要涵盖:(1左右”数据,财政部门内部,职能部门之间的数据。(2上下”数据,不同层级财政部门之间的数据。(3内外”数据,财政部门与其他部门之间,与市场之间的数据等。财政数据涵盖面的广泛性,决定了财政数据标准化建设是一项长期而艰巨的任务。

再次,采取有效措施,引导财政各个内部机构建立数据驱动型的工作机制,每个机构既是数据的使用者,也是数据的生产者。这其实是一场渐进式改革,在引导的过程中,可以采取“先予后取”的方式。目前,执行部门已经有很多数据,稍加整理就可以为预算管理处室和其他部门所用。

最后,对于财政以外的单位,财政既要建立合作共赢的数据共享机制,也要建立专门的数据收集保障制度。其中最重要的一项制度是“最小数据集制度”[①]。在美国它已经演变成一个一般性概念,指国家管理层面针对某个业务管理领域强制收集的数据指标,不少领域的“最小数据集”已经被上升到立法的高度。我们也可以参照西方发达国家建立财政对外的各类最小数据集制度。

(二)务实做好数据准备

数据的质量决定了大数据的应用效果。目前,财政部门的数据在传统工作模式下获得的数据,质量不高。开展大数据应用有必要提前规划数据,规划数据是一个长期过程,往往还伴随着业务流程和工作方式的调整。在全国财政系统有两个非常好的大数据规划例子:

一是国库集中支付电子化管理。国库集中支付电子化管理是通过电子支付方式,实现网上支付、自动对账、自动审核,提高了资金拨付效率,提升了资金安全管理水平,在实施过程中它借助业务流程重构和工作方式转变完成了数据规划。具体来说,首先,它通过制定《国库集中支付电子化管理接口报文规范》,在全国范围统一了财政、人行、预算单位、代理银行间国库集中支付数据交互标准,为全国财政支付数据的自动汇总和统计奠定了基础。其次,以电子化方式大幅提高工作效率为契机,将原来的汇总支付调整为明细支付,这意味着财政支付管理更加精细化。比如,财政系统有能力记录支农补贴、社保补助等涉及个人的支付信息,有能力关联功能分类、经济分类等更多的预算管理要素。省级的财政拨款明细笔数,正由千万级向亿万级发展。再次,正在形成全国“支付地图”。只要实现了支付电子化管理的财政厅局,财政资金流向、拨款构成都可以在地图上体现出来,可以实现实时获取支付信息,为即时分析支付行为打下基础。

二是非税收缴电子化工作。非税收入收缴电子化管理单纯从技术角度和表象来看是通过 “两码一渠道”,即全国统一的执收项目识别码、缴款识别码和缴款渠道,贯通财政、执收单位、代理银行及第三方支付机构,实现非税业务的一体化管理、集中式控制和电子化收缴。它背后隐藏着一个管理理念的创新--“订单式管理”,即把非税管理部门抽象为商品卖场,把非税收缴管理过程抽象为商品买卖的过程。可以这样类比,非税管理部门就像阿里巴巴公司,它提供了一个“淘宝网”。各个执收单位就是淘宝网上的商户,按照统一的规则进行商品买卖,缴款识别码相当于商品订单,项目识别码相当于商品品目。缴款人进行缴款,系统首先要自动产生一个订单(即缴款识别码),然后缴款人才能凭缴款识别码进行缴款。这样,对于一个执收单位来说,收缴任何一笔款项,都必须向财政申请一个订单号,这体现了“刷卡用餐”的思想,财政系统借此自动化收集订单申请所包含的执收单位业务管理、非税项目管理等信息,生产出高质量、内容丰富的财政数据。

可以说,以上两项电子化工作推进比较扎实的省市,相关数据质量就比较高,在相应领域开展大数据应用就具备了基本条件。

(三)合理规划相应系统

开展大数据应用最终体现在系统支撑上,但不同种类的系统会表现为不同的大数据应用方式。可以归纳为三种情况:

1.数据中心(数据仓库)应用方式。数据中心是一种“管理全组织的信息化数据的框架”,能为本组织各部门提供数据查询、数据发布、数据分析等功能,能为管理决策层提供一个对全部数据的宏观的、全面的把握。建设数据中心,标志着数据应用水平有了质的提升。但构建一个完善的数据中心是一项非常复杂的工作,是一个不断完善,螺旋上升的过程。一般而言,数据中心构造模式包括自顶向下、自底向上、平行开发三种模式。其中,自底向上模式的设计思路是先具体、后综合。建议财政部门采取这种方式建设数据中心,一是先将质量较好的数据纳入进来,然后逐步扩展。二是先提供数据查询、报表统计等服务,再进行数据挖掘和模型分析。总之,初期目标不要太高,实现对整体决策的支持需要数据质量、需要数据分析能力等,要有一个过程。

2.专项业务系统。对专项业务应用系统的大数据支持,有赖于数据中心的作用的发挥。主要有两类应用:一是数据共享。一般表现为获取数据,形成报表。技术上实现简单,但注意要从数据中心直接获取数据,避免相应系统两两互联。二是联机分析处理(On-Line Analysis Processing, OLAP)。这有赖于数据提供什么数据模型支持。总之,一般专项业务系统的大数据应用由数据中心完善程度决定。

3.平台类系统。这类系统也可能是专项业务系统,但不管怎样的表现形式,它们本质上是数据汇集的平台,如国库集中支付系统、非税收入收缴系统、政府采购网上平台等,都具有独立开展大数据应用的价值。这类系统需要从本身的技术架构和需求架构上做大数据应用设计。目前,河北正在开展的预算单位差旅电子凭证网上报销试点工作,在公务平台设计之初,他们即做了大数据应用规划。一是在技术架构上采取了云计算、云存储模式,确保将来可以实现快速联机分析处理。二是在数据生产方面提前为大数据应用场景做了考虑。比如,公务人员预订一张机票,系统会自动记录该航班市场最低价、市场最高价、本人成交价等信息,为成本分析做好准备。总之,对平台类这类系统开展大数据应用,尽管需要在技术架构和需求架构上做些调整,但涉及的外部制约因素少,可以以较低成本,在较短时间见到大数据应用效果。

 

参考文献:

1〕吕炜.国家治理现代化视域下的大国财政.人民日报,2017.1.17.

2〕财政部国库司编著.大数据时代:推开财政数据挖掘之门.经济科学出版社,2013.7.

3〕涂子沛.大数据.广西师范大学出版社,2012.7.

4〕王坚.在线数据改变商业本质,计算重塑经济未来.中信出版社,2016.10.

5[]凯文·凯利.必然.机械工业出版社,2016.1.

 



[]所谓“最小数据集”,是指为掌握一个研究对象所具有的特点或一件工作所处的状态,其核心是针对对象建立一套精简实用的数据指标,而通过收集最少数据达到这个目的的指标集被称为 “最小数据集”。


【返回】 【打印】 【关闭】