大数据如何破解腐败
数据正在改变反腐斗争。接下来,我们将用两个故事(一个来自巴拿马,一个来自巴西)阐明这场运动的来龙去脉。
我们首先来关注发生在巴拿马的故事。2016年4月3日,全球媒体铺天盖地地报道了一系列关于全球最富有的人如何逃税的新闻。在国际调查记者联盟(ICIJ)的精心安排下,来自76个国家的记者开始共同协作,发表报道,揭露富人们怎样别出心裁地向税务机关隐瞒财产。这些行动是根据莫萨克·冯赛卡律师事务所(Mossack Fon-seca)所泄漏出的大量数据而采取的。该律所总部位于巴拿马,专门从事财富管理和“税收优化”,它所泄露的数据涵盖了近40年来的全球范围内的避税行为,并包含了避税公司客户用以隐藏他们合法或非法获得财富的不透明离岸公司、信托和基金会信息,包括犯罪集团和非法武器交易等黑色产业收入。这是记者和数据科学家多年来秘密调查的结果。
记者所披露出的信息包括来自约21.5万个离岸银行账户和空壳公司的1150万份文件, 数据容量达2.6太字节 (TB)。国际调查记者联盟为记者提供了让这些文件透明化所需的 数据挖掘专业技术。Linkurious 等数据分析初创公司提取了元数据,并通过数据可视化工具把这些信息串联起来。信息的云端存储让全球近400个记者得以在一个项目上协同工作。
泄露这些信息的动机是富人逃税所体现出的全球不平等加剧所带来的不公正。
“收入不平等是我们这个时代最典型的问题之一,”泄露文件的匿名举报人在2016年5月6日德国慕尼黑的《南德意志报》上写道,“这会影响到我们所有人,影响全世界。关于全球不平等问题突然加剧的争论已经流行了许多年。……但是,问题仍然存在,为什么?为什么这个问题现在愈演愈烈?巴拿马文件给出了令人信服的答案:无处不在的大规模腐败。”他对腐败的担忧得到了全球年轻人的共鸣:最近,世界经济论坛对181个国家的千禧一代进行的调查显示,他们中近60%的人将腐败视为其国家面临的最严峻挑战。
我们再来关注发生在巴西的故事,数据的公开引发了国营石油巨头巴西石油公司逃 税和回扣方案的丑闻,并使得迪尔玛·罗塞夫总统下台。在席卷巴西全国的大规模抗议和反诉中,很容易忽略导致罗塞夫总统在2016年8月31日被弹劾所涉及的严格的技术司法案件。实际上,罗塞夫被指控挪用了政府预算——大多数人认为她通过在会计账目上弄虚作假来掩盖公共财政的真实状态。非营利组织“开立账户”(Contas Abertas)率 先发现了这些违规行为,该组织审查了依据巴西信息公开法律公布于两个主要政府透明门户网站联邦预算网(Orçamento Federal)和透明门户网(Portal da Transparência)上的预算数据和文件。“开立账户”将这些违规行为透露给了巴西联邦审计法院(TCU)。 联邦审计法院展开了调查,政治程序紧随其后。看似矛盾,但恰恰是政府对透明度的强制要求为揭露政府策划的骗局铺平了道路。巴拿马文件丑闻体现了数据分析揭露腐败的强大能力,要在一个充满太字节的世界里实现这种能力,所需的仅仅是计算能力。罗塞夫弹劾案展现了如何使用开放数据对领导人问责。
这两个故事共同展示“大”而“开放”的数据如何通过快节奏、证据驱动和众包的行动来推动反腐斗争。开放数据可将大量的信息提供给无数的监督人和揭发者。大数据可以将这些信息转化为洞察,使腐败更易于识别、追踪和预测。为了兑现这场运动的所有潜能,技术专家、活动家、官员和公民都必须加倍努力,将数据分析融入政策制定和政府机构中。