大数据如何破解腐败
数据分析的多面性
公开大数据本身并不能推动反腐工作。2014年白宫发布的一份关于大数据和个人隐私的报告强调:“我们可以对大数据集全部或有选择性地存储和检索,但是如果不做分析,我们得到的结果和输入的东西是完全一样的。”
在此背景下,有必要区分数据分析的四个主要阶段来体现其在全球反腐行动中的潜力:在分析复杂的政治问题时,“描述性分析”使用数据来描述已发生的事情;“诊断性分析”更进一步,通过挖掘交叉验证数据来解释某一具体政策问题出现的原因,找到根本原因,并解读潜在的结构化趋势;“预测性分析”通过机器学习,使用数据和算法来预测接下来极有可能发生的事情;“规范性分析”则提出应该采取怎样的行动来促使或阻止某件事的发生。 数据分析在反腐领域内的几项应用都有着不错的前景。众包,特别是通过移动应用程序,可以为公民提供有效的工具去发现各种腐败迹象。移动技术让公民能够更便捷地获取公开信息,为他们提供对公共服务进行投诉或谴责不当行为的渠道。
比如,在印度,一项名为“我行贿了”的应用程序让公民举报官员的受贿和欺诈行为来打击腐败。同样,哥伦比亚总统的政务透明度秘书处研发了一款应用程序,可以让公民举报未完成的或花费过高的公共工程。据《时代报》报道,到 2015 年底,总共发现了83项这样的公共工程,总价值高达5亿美元,并促使执法部门启动了刑事诉讼。然而,这两款应用程序都未实现公民和官员之间的双向互动,也不开放匿名的原始数据供公民自行分析,或许这是出于隐私的考虑。但是,这两款应用确实生成了大量的数据供欺诈调查人员和反腐败机构使用。过往的经验表明,这样的众包反腐行动在同监管机构和执法部门相结合时最为有效。
数据挖掘技术也被应用于更积极的公共财政监督。数据挖掘通常指深入数据中开展机器学习探查,在没有设定研究问题的情况下发现其中存在的模式。纽约市是这一领域内的先驱。2010年,纽约市审计长办公室推出了透明度门户网站,公开了纽约市700亿美元的年度预算,供公众监督。这个名为“纽约账本 2.0”的网站旨在“将政府支出放在纳税人触手可及之处”。市民可下载数据并使用数据分析技术来揭示可能会产生风险的预算模型,从而产生强大的威慑作用。社会组织也可使用这些开放数据来更有效地监督政府。比如,美国政治研究中心推出的 OpenSecrets.org 网站使用联邦选举委员会的数据来监控竞选活动的经费,追踪金钱在政治中的影响力。同样,无党派组织阳光基金会使用公民科技(civic tech)、开放数据和数据分析等工具来提高各州和联邦政府的透明度,并改善其问责机制。
政府采购历来容易受到任人唯亲和回扣的影响,大数据分析可帮助公众监督公共采购合同执行的效率。2011年,斯洛伐克通过立法加强公共采购的透明度,而透明国际(Transparency International)的当地分会则利用新的公开数据系统来曝光医院采购效率严重低下的问题。在格鲁吉亚,透明国际的当地分会推出了一个开放源代码的采购监控和分析门户网站,从政府的中央电子采购网站提取数据并重新打包,以便对可疑交易进行调查(尤其针对非竞争性合同)。捷克、匈牙利和斯洛文尼亚也都出台了类似的方案。
欺诈分析正在帮助政府通过检测可疑交易来减少公共事务中的逃税和欺诈行为。比如,在美国,医疗保险与医疗补助服务中心在支付赔偿金之前利用预测性分析来标示出疑似索赔欺诈情况。据《财政时报》报道,欺诈预防系统能够实时识别高风险的医疗保健提供商,发现浪费、欺诈和滥用行为。该系统已经阻止或识别了 420 亿美元的欺诈性付款。在巴西,联邦反腐败机构使用欺诈分析将该国最大的社会福利项目“家庭补助金”的受益人名单与联邦汽车登记处的汽车所有人进行比较,鉴别出数以千计不符合资格的受益人。进一步的挖掘显示,巴西富人通过以“家庭补助金”受益人的名义对其汽车进行虚假注册来避税。
考虑到纳税人和国家之间大量的互动以及一直存在的逃税风险,将反腐败分析应用 于税务管理的时机已经成熟。例如,澳大利亚税务局正使用大数据来搜索海量的记录,从而找到利用“避税天堂”逃税的证据,并使用数据匹配来鉴别未履行履约义务的网上小零售商。在卢森堡泄密丑闻中,一名举报人公布了有关逃税方案的数据,时任财政部长大卫·弗兰科尔(David Frankel)使用的分析技术有助于确定税务审计目标,并提升了对有漏税或逃税嫌疑的公司进行调查的效率。