作者凃子沛以美国为例,讲述了“数据不仅可以治国,还可以强国”的观点,美国社会之所以发达高效,引领世界科技的发展,与其尊重数据,收集数据的传统是分不开的。数据被视为科学的度量、知识的来源。没有数据,无论是学术研究,还是政策制定,都寸步难行。“数据驱动决策方法”使得政府更有效率、更加开放、更加负责。大数据是一柄双刃剑,数据虽然可以造福于民,但是也可能成为控制人民的工具。2013年的“棱镜门”事件揭露了政府对于人民的监控,引起轩然大波。数据也是一种资源,政府使用纳税人的钱收集了数据信息之后,需要将数据进行公开,这样既可以集中大众的智慧,利用数据科学地治理社会;也可以让大众对政府的行为进行监督,避免政府的腐败。因为缺乏竞争,官僚体制与生俱来有一种僵化保守的本性,政府机关也往往固守不前。很多数据都被以机密为借口封存起来,人民就无从得知政府的各项举措是否合理,因此在黑暗中就滋生了腐败。
下面讲一个小故事来说明大数据的巨大作用。
欧洲大部分的发达国家都实现了全民医疗保险制度。但作者对这种全民福利的做法,长期以来,美国社会并不认同。不认同的原因主要有两点:一是对政府的不信任;二是认为如果政府对公民大包大揽负全责,公民就会对自己不负责。在这种态度的主导下,美国的福利制度,一直以来都是以具体的项目为依托、以特定的群体为目标来开展的。其中,两个最大的医疗福利计划是1965年通过的,也是第36任总统约翰逊促成的:一是专门针对残障人士和65岁以上老人的医疗保险,二是以贫困人口为对象的医疗补助计划。也就是说,老、弱、穷看病,政府买单。由于两个计划都是针对社会的弱势人群,它们之间也互有交叉,例如,对于老年的贫困人口群,就可能同时适用两个计划。福利政策在全世界最大的争议,就是福利滥用、最后养了懒人,导致社会发展缺乏动力。美国虽然慎之又慎,但这两块免费大蛋糕,也不例外。2008年,联邦调查局在《财务犯罪年度公开报告》中估计,联邦政府每年的医疗开支当中,大概有3%到10%涉嫌造假和欺诈。
面对利益,人类的创造力总是无穷的:虚假账单、重复申报、无中生有,小病大治、慢治、长治,隐瞒收入和存款、装穷吃低保,林林总总,不一而足。两个项目的受惠人群,加起来有近1亿人,平均每人每月上一次医院,一年就有12亿张账单,按照联邦调查局的估计,大概会有3600万到1.2亿张账单存在问题。如果要依靠人力去张张审查,其工作量是难以想象的。目前,CMS中心最主要的措施,就是通过数据来打假。
2001年,加州州政府率先推出了一个数据挖掘的项目“保险补助双向核对”,将医疗保险和医疗补助两个项目的数据整合起来,利用两个计划中的人员、时间、价格、地点等数据信息对每一宗申报进行互相核实,通过计算机算法自动确定相互矛盾、有异于常态的支付记录,一旦发现造假或者不实申报的可疑账单,则转入人工追讨的环节。
这大大缩小了人工审查的范围,提高了打假的效率。
由于效果显著,2004年,这个项目在个别州的实施范围进一步扩大,由事后追讨推进到了事前防范。这意味着,CMS中心一收到申请报销的账单,就启用数据挖掘系统对该申请的数据记录进行“风险评分”:得分低于预定风险额度的申报则转入自动支付的环节;得分超过该风险额度的申请将退回申请人,或提交专门的小组进行人工复审。
支付后的账单,最后还要经过另一个数据挖掘算法的审核,发现可疑的,再转入人工追讨的环节。
以上措施的效果非常显著,很快引起了美国国会的重视。大部分国会议员都相信,数据挖掘的做法将为国家节省开支。在对大多数联邦机构削减经费的情况下,国会却给CMS中心下拨了专款,用于成立扩大专门的数据挖掘审查队伍。卫生部甚至主张,这种数据打假的项目应该纳入国家医疗信息系统基础设施建设的范围,换句话说,以后的医疗系统,在设计阶段,就应该包括数据挖掘的打假功能。
数据挖掘还常常能给工作人员带来一些意外的惊喜。例如,Neulasta是一种治疗癌症的注射剂,2006年,CMS中心的算法发现,不同医院提交的Neulasta账单不一致,有的账单使用毫克作为单位,有的账单使用瓶作为单位,而一瓶为6毫克。经过调查证实,使用瓶的账单属于“有意或无意”的人为错误,但这个错误,把申报的开支扩大了6倍。仅该项发现,就为联邦政府挽回了近50万美元的损失。
2007年3月,CMS中心的首席财务官希尔(Timothy B. Hill)出席国会的听证会,他例举了数据挖掘项目实施一年多之后的效果:通过数据挖掘预设的风险评分门槛,确定了2500万美元的虚假申报,事后的数据挖掘复审环节又追讨了1500万美元的超额申报;其中,有50多宗欺诈案浮出水面,最后移交司法部门处理。
除了CMS中心,联邦政府的社会福利项目都陆续开始采用数据打假的做法。2010年10月,为了削减赤字,奥巴马在白宫和他的技术顾问委员会召开会议,IBM、DELL、Intel等大公司的CEO向他建议说,联邦政府如果在社会福利的项目上加大数据挖掘、分析技术的应用,预计10年内可以再为国家节省2000亿美元。
将数据分析大规模地引入到治安管理工作中的做法,起源于纽约。纽约,是全世界的金融和商业中心。也是美国人口数量最多、密度最大、多元化程度最高的城市。因为人口众多,不免鱼龙混杂,纽约也曾经是一个著名的犯罪之都。从上个世纪70年代起,黑帮横行、毒品泛滥,该市的治安情况不断恶化。
1994年,纽约市的警察部门启用了一个新的治安信息管理系统。这是一个以地图为基础的统计分析系统,随着它的出现,纽约城的治安开始逐年好转。这个叫做“CompStat”的系统也开始名扬全国,成了20世纪美国警务管理工作当中最为浓墨重彩的一笔。
Compstat,是Computer
Statistics(计算机统计)的缩写,现在已经演变成为一个专有名词,特指一种警务管理模式。这是一个传奇故事,一个源于地铁,发生在一位巡警、一位局长和一位市长之间的传奇故事。
1970年,杰克·梅普尔刚刚高中毕业,他加入纽约市交通警察局成为一名地铁线上的警察。当时,地铁线上的抢劫案非常频繁,地铁警察,被认为是纽约最危险的工作之一。
为了追踪抢劫案,梅普尔在时代广场做过便衣,在中央车站指挥过拦截和抓捕。在十几年街头警察的经历当中,他慢慢“悟道”:案件发生在哪里警察就出现在哪里,是让罪犯牵着鼻子跑;要控制局面,抓到老鼠,警察一方必须掌握主动,做一只有“预测能力”的猫。
于是,这位高中毕业生开始研究地铁抢劫案的发生规律。
梅普尔在办公室的墙上挂上了几百幅地图,用不同颜色的大头针来跟踪地铁抢劫案发生的时间和地点,分析其中的原因和规律。无数个夜晚,他点着香烟,站在巨大的地图面前,时而举头凝视,时而低头徘徊,揣度琢磨第二天可能发生抢劫的时间和地点。在一阵苦思冥想之后,最后用大头针按下的那个小点,就代表了他第二天的伏击地点。梅普尔后来晋升为警督(相当于派出所所长),他就采用这种方法来部署和调配他所辖区的警力。他的办公室挂满了地图,被同事戏称为“地图墙”,他却称之为“预测未来的图表”。
1990年,“预测未来的图表”引起了新任局长布雷特的注意。布雷特是位退伍军人,他雷厉风行、慧眼识才,在认真研究了“地图墙”之后,他认为梅普尔的方法很“靠谱”。于是开始在全局推广梅普尔的图表管理方法。
第二年,纽约市的地铁抢劫案下降了27%。
但纽约的整体社会治安并没有好转,除了地铁抢劫案,其他的案件都还居高不下。这更令布雷特相信,“预测未来的图表”确实行之有效。
1993年,治安持续恶化。这个问题,甚至成了纽约市市长竞选当中最热门的话题。这个话题也带来共和党候选人鲁迪·朱利安尼的政治机遇。
朱利安尼出生于纽约市的一个普通劳工家庭。他1968年法学院毕业之后,长期在司法部门工作。1983年,他晋升为纽约市的联邦检察官。在他担任这个职务的6年期间,朱利安尼先后将4000多名嫌疑犯送进了监狱,其中有不少都是轰动全国的黑道大哥、帮会首领。朱利安尼作为公诉人,多次受到黑社会的威胁,但他刚正不阿,始终秉法办案,在新闻界获得了“铁面”的美誉。
作为共和党的市长候选人,朱利安尼的主打牌就是“治安”。他在竞选演讲中介绍说,他的朋友在餐馆等公共场合碰到他,都不敢和他打招呼,因为怕被黑社会盯上、莫名其妙受到报复。他在街上,也经常碰到一些刑满释放的人员,那些人对他做出鄙夷的表情,并当面嘲笑他说:“你没人缘,选不上!”
朱利安尼却呼吁说,如果纽约人民真正想改善治安,就不能让他落选!因为他是改善治安最好的人选——别无其他!
他的演讲,情理并茂,他的铁面形象和诚恳的态度,最终打动了纽约人,得以高票当选。
一上任,朱利安尼就立即任命布雷特为纽约市警察局局长。而布雷特到任的第二天,就任命梅普尔为第一副局长,并要求梅普尔立即组织开发一套电子版的“预测未来的图表”。
“CompStat”于是诞生了。1994年,互联网还没有普及。CompStat的工作人员每天通过电话和传真向全纽约76个警区收集数据,再将数据统一录入到CompStat,进行加总和分析。
每周二、周四的早晨7点,布雷特就召集全部警区的指挥官开会。最新发生的案件以圆点的形式出现在各个辖区的地图上,不同颜色代表着不同类型的犯罪,特定位置的成串圆点则表明那里发生了一系列的案件。各个指挥官在这些“绩效指示灯”前面依次陈述自己辖区的情况、对策以及警力的调配,一个回合下来,不少人满头大汗。
为了保证CompStat的落实和推行,布雷特一共撤换了近三分之二执行不力的指挥官,可谓“铁腕”。
次年,纽约的犯罪率应声而降。使纽约跻身全美最安全的大城市行列。
纽约的巨大成功,很快引起了其他地方政府和联邦政府司法部的注意。90年代起,全美各地有近三分之一的治安管理部门都陆续复制引进了CompStat的管理模式。
梅普尔后来辞去了公职,创办了一家咨询公司,帮助全国各地的大小警局实施CompStat系统。
1996年,CompStat获得了哈佛大学的美国政府创新奖。此后,CompStat甚至进入了美国总统和副总统的视野。
1998年10月1日,副总统戈尔宣布,司法部要会同全国政府改革合作委员会15成立专门的工作组,在全国的警务部门研究推广“地图映射和数据驱动的治安管理”。克林顿总统甚至在1999年的国情咨文中,也提到这种新的方法和系统。
网友评论