王雍君/中央财经大学
内容提要:绩效陷阱(performance trap)定义为绩效信息被错误或不当计量与应用,进而招致非意愿后果的风险。本文鉴别了四类主要的绩效陷阱:偏离目标成果、战略择劣、环境噪声以及拨款与绩效计量的机械挂钩。在此基础上,本文提出三项应对措施:将成果陈述与战略规划融入预算文件与过程、分离噪声效应、定期独立评估资金需求。
关键词:绩效陷阱 战略计划 噪声分离 需求评估
公共部门的绩效评价与管理依赖绩效计量,即以量化的方式获取绩效信息的作为。但相关文献已经指出,必须小心那些糟糕的绩效计量体系,因为它比没有绩效计量更可怕。[1]鉴于绩效评价与管理在中国已经全面铺开,辨别和规避绩效计量与应用陷阱,对于促进绩效运动步入正轨至关紧要。基于此,本文对四类主要的绩效陷阱进行了分析鉴别,并提出具体的应对措施。
一、偏离目标成果
目标成果即与社会期望的目的与目标相一致的财政成果,主要涉及政策与规划两个层级。鉴于成果(outcome)为政府活动提供方向,也是管理决策的基础,偏离目标成果可视为最重要的一类决策陷阱,涉及许多情形。
(一)偏离适当性
适当性(appropriateness)论证要求表明采纳一项干预对解决特定问题是合理的,旨在确立政府行动的适当基础。未通过适当性测试暗示干预措施本身就没有(多少)意义。主要的干预措施是政策与规划,后者作为政策执行的同义词。
以“水体洁净规划”为例:目标成果可描述为“3年内使70%的地表水从C类水质达到A类水质”。这项计量满足适当性测试标准吗?
而合理性应基于必要性、可行性和最优性的论证,以及基于市场失灵的边界分析、效果评估和归宿分析,[2]后者强调对贫困阶层的影响。必要性论证应基于两类相关性(relativeness):需求相关性和政策相关性。需求相关性关注与客观社会需求的关联,政策相关性关注与政策优先性之间的关联。
假如“水体洁净规划”本身就被证明没有必要,或者虽有必要但方案选择明显不当,目标成果的上述计量就坠入了陷阱:偏离适当性。在这种情况下,即使3E计量令人满意,也不表明决策是成功的或者可接受的。3E即有效性、效率与有效性,分别联结结果导向、过程导向和投入导向,每个都以适当性论证作为先决条件,否则其意义与价值将被大打折扣。3E计量的主要缺陷在于并不关注“目标成果”本身的适当性,关注的只是目标成果的实现程度(有效性)、实现方式(效率)和代价(经济性)。3E计量对方案择优也不充分。[3]
(二)把战略当作目标成果
战略即指在达成目标成果的策略、方法与方式。目标成果引导“做正确的事”,战略引导“正确地做事”。前者聚焦目标与方向,后者聚焦战略。所谓“条条道路通罗马”,“罗马”代表目标成果,道路(海陆空)则代表战略。把战略混同为目标成果引发糟糕决策的风险极高。
举例来说,假设“解决无房者的居住问题”被当作住房保障政策的目的,正确目标可被计量为“3年内在政府帮助下解决10万个无房者的居住问题”。如果将目标表述为“3年内通过建设和分配公共廉租房解决10万个无房者的居住问题”,就会导致计量陷阱:瞄准错误目标——“建设和分配廉租房”——进行计量。实际上,建设和分配廉租房只是达成目标的战略之一,把它当作目标计量导致排斥其他很可能更好的战略,比如分发住房券和提供住房补贴,由此招致的非意愿后果远高于想象,但常被忽视。
(三)目标与目的间的不一致
包括两类情形:政策目标与目的间的不一致,规划目标与政策目标间的不一致性。以儿童发展政策为例,如果政策目的界定为“促进儿童健康成长”,政策目标却界定为“提高儿童英语会话能力”,就犯了以偏概全的错误,即目标不能准确完整反映目的的那类错误。
相反,以下界定要好得多:把政策目标界定为“5年内使目标儿童的综合素质整体提升20%”,为此设计三项规划:(1)“儿童体能规划”,目标界定为“5年内目标儿童体能提高30%”;(2)“儿童保健规划”,目标界定为“5年内目标儿童疾病发病率降低25%”;(3)“儿童认知教育规划”,目标界定为“5年内使目标儿童的认知能力提高10%”。
此例涉及的绩效变量:1个一级综合变量即“儿童综合素质”,3个二级绩效变量即“儿童体能”、“儿童疾病发病率”和“儿童认知能力”[4]。这些都属于成果变量,即与根本的目的性关切——儿童健康成长——联结得最为紧密的变量。其他绩效变量均应瞄准成果变量,无论结果导向、过程导向还是投入导向的变量。
注意不应将目的本身当作绩效变量。此例中的“儿童健康成长”并非绩效变量,而是绩效变量应瞄准的目的。
(四)把产出当作目标成果
这类陷阱十分常见,具体原因相当复杂,包括动机扭曲和成果计量的困难。原则上,产出应联结成果而被选择,因为产出是成果的手段和先决条件,没有产出就没有成果。然而,产出选择经常被狭隘利益扭曲。举例来说,抛开学术水平不谈,与代表作(产出1)和引用率(产出2)相比,论文发表数量与规格(产出3)作为考核标准的体制,明显地有利于掌握或贴近权力和“关系圈子”的人。
在这里,目标成果可界定为“知识创新与社会贡献”,产出1(基于严谨评价)和产出2与其关联明显强于产出3,但产出3却大行其道,因为与许多诱人的狭隘利益紧密相连,包括职称、经费、获奖和声望。科研论文的成果评价的固有困难加剧了这种“一边倒”的倾向,以至科研资源配置决策中“劣币驱逐良币”非常严重,而且这只是公共支出管理中的冰山一角。久而久之,社会便无可救药地患上慢性病,并陷入集体性迷失状态而难以自拔。什么是真正的目标成果,什么只是达成目标成果的产出,以及最有利达成目标成果的产出究竟是什么,正是当代中国最具反思性价值的课题,尤其是在公共部门绩效运动兴起的背景下。
(五)绩效标准不明
在绩效标准未被明确界定的情况下,机构和公仆倾向于以自己理解或利己的方式配置与使用资源。以“土地储备规划”为例子:向某机构提供5000万元拨款以增加土地储备,作为未来开发建设之用。该机构将如何行事呢?非意愿后果是什么?
由于绩效标准未被言明,可以预料,该机构倾向于以成本最低、面积最大的方式购置土地,而不去顾及环境与生态效益。于是,土地储备越多,用于商业开发的土地也越多,环境与生态则每况愈下。修正这类非意愿后果的方法很简单:补助基于环境与生态保护的目标(成果),而非基于面积(产出),以促使机构改变选择土地的方式。
二、战略选择陷阱
目标成果旨在为决策提供至关紧要的目标感与方向感,用以约束与引导“做正确的事”;战略指在建立达成目标成果的策略、方法与方式,用以约束与引导“正确地做事”。决策不仅要求瞄准适当的目标成果,还要求瞄准适当的战略。战略无法通过适当性测试的风险称为战略选择陷阱,即“战略择劣”而非“战略择优”的风险。易言之,好的战略未被采纳,不好的战略反而被采纳,这是战略选择上的劣币驱逐良币。
战略需要“被决策”和“被计量”,一如目标成果。在“条条道路通罗马”的例子中,目标成果指的是“罗马”,战略指的是“道路”。战略可简要定义为如何从此岸到达彼岸。[5]假如“空路”优先“海路”,“海路”优于陆路,但决策的优先性排序恰好颠倒过来,或者最优的“空路”、次优的“海路”未被选择,最差的陆路反而被选择,即陷入本节定义的战略优先性陷阱。
在扶贫规划的例子中,目标成果可界定为“3年内减少50%的贫困人口”,可鉴别的相关战略至少包括:(1)机会扶贫,即增加脱贫机会;(2)能力扶贫,好致力提高脱贫能力;(3)物质施舍,即提供现金、帮助建房等;(4)互助合作,即把贫困者纳入一个集体合作网络。这些战略各有优劣。相对而言,施舍战略最不可取,因为诱使偷懒并加剧财政压力和纳税人负担,而且“制造”更多贫困和更多的返贫。一般地讲,只是在“需被救济”的情形下,施舍战略才可能是适当的;然而,施舍战略甚至比其他战略更受重视。
战略选择陷阱在实践中比比皆是。除了政治障碍[6]外,战略陷阱主要源于绩效计量的缺陷。扶贫规划即为典型例子:许多国家和政府将贫困定义、进而计量为“人均或家庭平均年收入”低于规定标准。这很简单,但也埋下诱发战略选择陷阱的种子。如果改变定义和计量,比如将贫困定义和计量为“无力自食其力者”,那么,采用更优战略的概率就要高得多,因为这类计量并未将注意力瞄准财富指标,而是瞄准如何强化“自食其力”,这有助于将注意力引力机会、能力和合作战略。由此可知,从某种意义上讲,有什么样的计量,就有什么样的战略选择。
就计量原因而言,战略选择陷阱源于对成果、产出、投入的错误或不当计量,也就是对综合了3E的成本有效性的计量缺陷。在扶贫规划的例子中,成果计量有四个选项:超过被精心界定的“收入贫困线”、“机会贫困线”、“能力贫困线”和“合作贫困线”[7]。可以预料,采用不同的成果计量,不同战略的选择概率各不相同。举例来说,若收入贫困线被当作主要计量,那么,施舍战略被选择的概率更高,隐含“施舍战略更有效”的认知。成果计量聚焦有效性,即实现目标成果的程度。
给定成果计量,产出计量也可能存在缺陷,尤其是忽视对产出与成果间关联程度的计量。在这里,焦点不是产出的数量、质量、成本,而是对成果的贡献大小——产出的有效性。关联度越高,产出的有效性越高。举例而言,如果成果被计量为“超过能力贫困线”(的人口%),至少涉及三项产出计量:医疗服务(产出1)、技能培训(产出2)和抵御灾害(产出3),分别联结健康资本、知识资本和风险资本。如果计量重心是产出1,其次是产出2,产出3被忽视,那么,能力扶贫战略的次级(产出)战略的选择也可能如此排序,但也可能是错误排序。比如在自然灾害频发的地区,政府抗灾救灾服务比培训可能更重要。
给定产出计量,投入计量的缺陷也会带来类似风险。投入计量的焦点是经济性,两个主要成分分别是性价比和浪费。超出必要即为浪费。对给定产出而言,经济性越高的投入组合越应被选择。投入即资源本身,包括人力、物力和财力和技术,每个都可细分。在扶贫规划的例子中,当产出被计量为技能培训时,那么至少有两个三级(经济性)战略可供选择:现场培训和网络培训。如果投入计量瞄准前者而忽视后者,那么,前者被选择的概率将高于后者,这与“有怎样的计量就有怎样的战略”完全一致。
概括地讲,旨在实现目标的战略选择涉及三个层级:对应成果有效性的一级战略,对应产出效率的二级战略,对应投入经济性的三级战略。相对而言,当代绩效管理突出强调了效率价值观。[8]三个层级反映3E计量在战略选择上的具体应用。战略本身也是绩效管理的重要对象,应与3E价值相一致,并确保处于适当性价值的约束与引导之下。适当性计量关注政府行动的适当基础,主要用于指导对目标成果的界定与计量。
三、环境噪声的干扰
多数公共政策与规划都会遭遇环境噪声,而且扭曲决策的风险很高。环境噪声(environmental noise)指影响绩效变量、但在很大程度上不可控的环境因素,既干扰决策、也干扰评监、还干扰激励,类似环境杂波对雷达捕捉目标造成的干扰。环境噪声对绩效变量的影响称为噪声效应(noise effect),影响结果链的各个成分:对成果的影响最大,其次是产出,最小的是投入。环境噪声也会影响目标变量。只要财政决策瞄准这些变量,就存在被环境噪声扭曲的风险,即决策因为噪声干扰而错失正确目标的风险。
如果就业率提高的原因中,有80%归因于经济形势的改善,其余20%归因为政府的就业培训规划,这意味着该项规划的支出的约80%陷入了噪声决策陷阱,也就是做了无用功,这是浪费(waste)概念的一种特定形式,只不过这种浪费并非人为,而是噪声干扰所致。
假如植被覆盖率的提高完全归功于气候变化,“退耕还林”等环保规划的贡献为零,亦即噪声效应达成100%,那么,决策就被完全扭曲,也就是因噪声干扰(“迷惑”)而致全盘失败,资源被全部浪费。然而,表面上根本看不出来,除非对噪声效应进行计量和分离。噪声效应对决策极具迷惑性,让人们误以为管理努力是有效的;实际上,这种“有效性”只能部分归功于规划效应(program effect),部分归功于噪声效应;两者的相对比例取决于环境噪声的大小。
完全的噪声效应非常少见,但许多政策和规划的噪声效应相对很大,如果未加计量,扭曲决策的风险很高。更一般地讲,环境噪声干扰绩效管理的所有方面,包括决策、评估监督和激励机制。目前国内的绩效运动中,噪声问题仍未被充分关注和讨论。就绩效评价而言,在噪声效应较大并且未独立计量和分离的情况下,很难得出关于成败得失及其原因的准确判断,这会进一步干扰绩效决策与激励。因此,绩效计量不应仅仅以瞄准目标成果的方式设计,[9]亦应以有利于鉴别与分离噪声效应的方式设计。
四、拨款与绩效计量机械挂钩
预算拨款用来为预算实体提供使用公共资金的授权,以使其履行职责和达成任务。作为财政绩效管理的关键成分,拨款管理涉及两个基本方面:作为决策工具和作为激励工具。两个工具遵从两套不同、但都正确的逻辑:拨款决策受政策驱动,服从于政策重要性,无论管理质量即绩效好坏;拨款激励(奖罚)受绩效驱动(driven by performance),服从于管理质量,无论政策重要性如何。在拨款被要求与绩效计量机构挂钩时,冲突和非意愿后果就发生了。
举例如下:面积为10000平方公里的湿地保护规划由于其政策重要性而一直得到充足拨款,但绩效评价结果表明管理质量很差,按照绩效逻辑应削减30%的拨款,这将导致经费不足而不得不将保护面积缩小2000平方公里。是否可行和适当?
答案当然是“否”。因为缩减面积可能招致严重的负面后果,包括生态与政治后果。因此,即便管理质量低劣以至绩效很差,也不应削减拨款,有时甚至应该增加拨款,比如在只有弥补被浪费掉的资金缺口才能保证管理质量的情况下。
再举一例:绩效评价结果表明公车管理质量良好,按照绩效激励逻辑奖赏500万元人民币的拨款以采购20辆新车。是否可行和适当?
在新车购置并非政策优先事项的情况下,答案就是“否”,尽管公车管理绩效良好。在严厉的公车政策下,甚至应该减少预算拨款,管理绩效良好也是如此。因为正确规则是管理质量服从政策重要性,或者等价地说,拨款激励服从拨款决策。相反的规则是拨款决策服从拨款激励,而罔顾政策重要性。在罔顾政策重要性的情况下,要求预算拨款与绩效计量(评价结果)挂钩之举,称为机械或武断挂钩。
机械挂钩的主要后果是预算拨款决策背离政策重要性的高风险,以至稀缺资源被引导到低公共回报的用途,通俗言之就是导致“雪中送炭不足、锦上添花有余”。雪中送炭意味着政策重要性很高,即使管理质量低劣导致绩效不佳,通常也不应削减拨款;锦上添花意味着政策重要性很低,即便管理质量很高因而绩效良好,通常也不应增加拨款。易言之,拨款决策服从政策逻辑,拨款激励服从管理逻辑;管理逻辑服从政策逻辑而非相反。拨款与计量的机构挂钩与此背道而驰。
五.如何消除绩效陷阱?
绩效陷阱通常伴随道德风险[10]和机会主义行为,诱发三种典型的非意愿后果:目标移位、行为变异(behavior variation)和解释困惑(confusion of interpretation)。目标移位指资源配置偏离目标成果和最优战略。行为变异指机构与公仆对狭隘利益的考虑压倒对普遍利益的考虑。解释困惑指绩效分析和评价的困惑。分析困惑即难以准确鉴别真相,评价困惑指对成败得失及其原因解释不清甚至自相矛盾。将“成果描述与战略计划”融入预算过程,独立计量与分离绩效噪声,以及定期独立评估资金需求,可作为消除绩效陷阱的最优方法。
(一)成果陈述与战略计划
成果陈述与战略计划应包含于预算文件呈递立法机关审查和批准,作为绩效导向预算的先决条件。预算文件中缺失正式的成果陈述和战略计划,正是目前中国的预算体制不同于和落后于发达国家的显著标志。预算文件中充斥的“要做什么”的话语,并未表明“目标成果”究竟是什么,也未表明旨在达成目标成果的“优先战略”究竟是什么。这样的预算文件很难帮助评估政府、机构与公仆是否在“做正确的事”,以及是否在“正确地做事”。
在这里,关键问题不在于政府是否创造了一定的成果,而是创造出的成果应该能够激励政府去检验其规划和政策,并采取正确的行动以应对环境变化带来的机遇与挑战。[11]此外,应从广阔的视野中建立成果陈述与界定的方法,尤其应审视规划结构(内部视点)和环境变化(外部视角)。
成果陈述应与战略计划区别开来,亦应结合起来。前者关注“做正确的事”,后者关注“正确地做事”,两者都作为环境变化的最佳应对策略。执政的本质就是回应环境变化抓住发展的机遇。为此,两项能力建设最为紧要:应变能力和修复能力。成果陈述和战略计划可作为推进能力建设的最佳起点。这也是建立预算导向预算体制的最佳起点,因为两者正是绩效目标被正确设定的前提。对改进预算申请而言和培植公共价值而言,成果陈述与战略计划同样至关紧要。[12]
(二)鉴别与分离噪声效应
鉴别与分离噪声效应至关紧要,因为环境噪声扭曲绩效决策与激励,也干扰绩效分析和绩效评价。总效应减去噪声效应即为管理效应,反映管理努力或政府干预对绩效的真实贡献。但这只是第一步,因为环境噪声和管理因素的区分相当粗略,未能呈现特定因素、尤其是主要因素对绩效的独立影响。影响绩效的特定因素通常众多,需要通过贡献分析予以鉴别和计量其影响程度。贡献分析用以鉴别管理贡献和噪声效应,归因分析通常采用回归法确认调整后的绩效计量。[13]回归法也可帮助用于确定绩效计量指标的适当权重。[14]
其他旨在消除或减弱噪声效应的方法包括:
1.对公私部门同类划的可比绩效基准进行对比;
2.采用独立基准分别评价运营流程和环境条件;
3.通过评估环境条件评估绩效管理前后的变化;[15]
4.以成果计量为辅、产出计量为主;[16]
5.采用更加主观的评价方法。
就噪声效应而言,绩效激励的根本问题是选择一种兼容性的绩效计量,即精确匹配政策与规划目标、又能令噪声效应最小化的计量。成果与目标的联系最强,扭曲效应最小,但噪声效应最大;投入恰好相反,产出则居中。最优绩效激励机制可定义为最小化扭曲效应与噪声效应的激励机制,绩效决策机制也是如此,但十分复杂棘手。
鉴别与分离噪声效应对受托责任体制建构也具有重要含义。噪声对产出的影响通常远小于对成果的影响,这意味着机构对产出的“可管理性”远高于成果。鉴于此,机构管理者对产出负责、政策制定者对成果负责的体制很可能是适当的;前者即管理受托责任,后者即政治受托责任。两者的区分只是相对的。[17]
(三)定期独立评估资金需求
预算拨款与绩效的机构挂钩会招致扭曲决策与激励的高风险(参见本章第一节和第二节),除非伴随独立的资金需求评估和非预算拨款形式的绩效奖罚。
举例如下:中小学生免费午餐规划的绩效评估结果显示,管理者因提高效率节约了资金1000万元。如何激励才是正确的呢?
首先,对绩效做出贡献的人予以奖赏,但不采用增减预算拨款的方式,而是采用诸如发放奖金、晋升和表彰等方式。其次,此项规划的后续预算究竟多少为宜,应基于政策重要性的评估而定,无论资金节约多少。
相对于绩效信息而言,政治敏感性或政策重要性才是决定预算拨款水平的决定性力量。试图以绩效力量取代政治力量在预算拨款决策中的决定性作用并不可行。这意味着绩效奖励与“应否增减预算拨款”应作为两个独立问题考虑,因为很难通过预算拨款的方式达到既改善绩效管理、又满足资金需求的目的。资金需求主要取决于政策优先性,这意味着即便绩效不佳,政策优先事项的资金需求亦需确保,削减拨款并不合乎所需;相反,那些政策优先性很低的事项,即便绩效良好,增加拨款也不合乎所需,甚至反而需要削减。
对许多深具政策重要性的规划而言,绩效不佳反而暗示需要增加预算。因为相对于政治考虑而言,绩效信息对预算拨款的影响总是次要的和辅助性的。把绩效评价结果的应用机械地等同于与预算拨款挂钩,不仅在逻辑是错误的,在实践中也可能有害无益。通用规则是:无论绩效或管理质量如何,定期独立评估政策、规划或服务的资金需求总是必要的。独立的资源需求评估也有助于消除与“绩效评价”概念的混同。[18]
参考文献:
〔1〕Stuart Kasdin. Reinventing reforms: how to improve program management using performance measures. Really. Public Budgeting & Finance. Fall 2010:51-78.
〔2〕Schick, Allen. 2003. The Performance State: Reflection on an Idea Whose Time Has Come but Whose Implementation Has Not. P75.OECD Journal on Budgeting 3 (2): 71-104.
〔3〕Ross Rubenstein, Amy Ellen Schwartz, and Amy Ellen Steifel. Better than Raw: A Guide to Measuring Organizational Performance with Adjusted Performance Measures. Public Administration Review63, no. 5 (2003): 607–615.
〔4〕Stephen Martin and Peter C. Smith. Multiple Public Service Performance Indicators: Toward an Integrated Statistical Approach. Journal of Public Administration Research and Theory 15 (2005): 599–613.
[1] Stuart Kasdin, ”Reinventing reforms: how to improve program management using performance measures. Really” Public Budgeting & Finance. Fall 2010:51-78.
[2]边界分析关注政府与市场的合理边界,强调政府干预集中于市场失灵最严重的领域,要求鉴别当前的干预措施何处“缺位”、何处“越位”。效果分析关注当前干预措施在多大程度上矫正了市场失灵,以表明这些措施是否充分。归宿分析关注赢家与输家,要求评估干预措施的再分配效应,涵盖负担归宿和受益归宿分析。
[3]在水体洁净规划的例子中,与生物净化和自然净化相比,投放化学物质可能效率更高或者更具经济性,但很可能并非最优方案,部分原因是造成二次污染以及破坏自然环境本身的净化机能。
[4]认知能力涉及各个方面,焦点应是社会回报很高的道德选择能力,即鉴识行为善恶、是非和对错的能力。
[5]这里指的是“路径战略”,不同于“定位战略”。定位战略旨在界定目标(彼岸确定于何处)。在公司中,路径战略称为竞争战略,定位战略称为发展战略,分别强调“做正确的事”和“正确地做事”。
[6]政治障碍指政治体制未能成功地阻断利益扭曲原则的作为。公共官员自处错综复杂的利益网络中,在公私利益冲突的环境中,总是具有优先考虑狭隘利益的自然倾向,从而扭曲战略选择。
[7]合作贫困线可采用社会资本(social capital)概念计量,至少可分四个等级:零合作、低度合作、中度合作和高度合作。每个都需细化和量化。能力贫困线中至少有两个关键成分:健康资本与知识资本。
[8]工业革命以来,由于各种因素的驱动,效率主义和个人主义成为当代社会区别于传统社会的两个主要标识。每个社会都被自觉或不自觉地卷入“个人至上+效率至上”的洪流而难以自拔,鲜有例外。然而,效率主义有其内在缺陷,尤其是在忽视长期效率(比如缓慢修建耐用300年的房子)、片面重视短期效率(比如快速修建只耐用70年的房子)的体制中。效率主义也与强调经济性价值、崇尚简朴生活的传统社会不相容,源于效率悖论:效率越高浪费越多,比如快速淘汰与更新手机等产品。效率社会还极大地激起远超出实际需要的奢侈性物质欲望,造就压力型社会、诱发社会涣散与价值观崩溃。
[9]多数计量都采用这些设计思路。据此,如果成果的绩效偏差需被跟踪,并在超出临界值时伴随纠偏措施。
[10]道德风险指从不道德的行为中获利,充斥于人类事务的许多领域如贷款和保险,主要源于有缺陷的激励机制。
[11]Schick, Allen. 2003. The Performance State: Reflection on an Idea Whose Time Has Come but Whose Implementation Has Not. P75.OECD Journal on Budgeting 3 (2): 71-104.
[12]传统上,预算申请强调表明“为何需要这么多钱”,而不是如何鉴别与应对环境变化带来的机遇与挑战。久而久之,“向内看”和“向后看”的倾向远远压倒了“向外看”和“向前看,造就僵化、形式主义与官僚主义。
[13] Ross Rubenstein, Amy Ellen Schwartz, and Amy Ellen Steifel, ‘‘Better than Raw: A Guide to Measuring Organizational Performance with Adjusted Performance Measures,’’ Public Administration Review63, no. 5 (2003): 607–615; Stephen Martin and Peter C. Smith, ‘‘Multiple Public Service Performance Indicators: Toward an Integrated Statistical Approach,’’ Journal of Public Administration Research and Theory 15 (2005): 599–613.
[14]回归分析可帮助鉴别噪声对不同产出、成果等绩效指标的影响程度的差异,以及对这些指标值与噪声效应值的相关性进行检验。那些噪声效应相对较大的绩效指标,应赋予更低的权重;反之亦然。
[15]举例来说:选择去年与今年天气状况相同的时间段,评估今年实施新的环保措施后空气质量的变化。
[16]噪声对投入的影响最小,对成果的影响最大,对产出的影响居中。假如成果完全取决于碰巧得来的运气,即噪声效应达到100%,计量成果便无意义。
[17]在绩效导向的管理框架和预算体制中,把不具政治敏感性或政策重要性较低的成果鉴别与成果责任指派给机构管理者,也可能是适当的。
[18]资源需求即究竟需要花多少钱,首先取决于政策重要性,其次才是绩效。如果因为绩效提高(成本节约和工作进度加快)导致资源需求减少,那么,预算拨款的相应削减就是必要的,但应伴随其他形式的绩效奖赏。