美文网首页程序员@IT·互联网
天真的英达先生:如何利用统计学看懂财务欺诈

天真的英达先生:如何利用统计学看懂财务欺诈

作者: 只是不在意 | 来源:发表于2017-02-26 20:10 被阅读0次

    日前,著名导演英达因为非法的“现金拆分行为”而惹上官非。作为美国绿卡持有者,在2011年4月到2012年3月之间的11个月之内,他先后把46.4万美元存入他和他妻子在四家银行的六个银行账户中。为了绕过监控,他每次存钱额度都低于1万元,前后分50次存入。

    根据美国法律,超过一万美金的存款就要填写“现金交易报告”,结合英达案来看,每次的转账貌似都没有构成违法,但是这种行为是有意为之。这种刻意的分立账户、分期分批打入钱财等情况,也自然不在法律允许的范围之内。

    对此,我的第一感觉是,英达先生一定没有读过统计学。他大概不知道,这种刻意的数据伪造,在今日的大数据运行效率之下,非常容易被计算机识别出来。

    在《剪刀石头布:如何成为超级预测者》这本书中,就介绍了不少数据伪造的案例,以及如何被识破的故事。除了人性中的心理影响以外,这些案例的破解,也和统计学中的概率有关。

     

    我们先说一个简单的:某个数学教授多年以来,一直在课堂上进行随机性实验。他让同学们分为两组,一组连抛硬币200次,并记录结果,另一组直接编造数据。

    然后,教授只需要扫一眼作业,就能几乎完全正确的判断出哪些是伪造的数据。

    你知道关键在哪里吗?抛掷200次硬币的真正随机数据,几乎肯定会出现6个连续的人头或字,但几乎没有人在编造随机序列的时候,敢真的这么做。

    还有一个案例,某个餐馆的老板做了假账,编篡了每个星期的营业额。而某位会计学学生正好在此打工。账簿在内行人眼里,错的非常明显:n多数据末尾中没有一个以00为结尾,因为伪造数据者往往认为整数不够随机。

    而在真正世界中,从00到99,每组两位数的出现概率约为1%。

    看,如果你不懂得统计学的概率,你肯定编不出来正常的数据,你会犯的错误包括,但不限于以下几方面:

    多次运用了个人偏爱的数字(每个人都有偏爱的数字);

    有意识的避免整齐的数字,或者连续的数字,以为它们“不够随机”;

    如果数据有上限,比如报销金额是500,你可能会多次采用478,485这类数字......

    当人们在数据上造假时,他必须捏造一系列看似正常,没有可疑之处的随机数字。而我们认为的“没有可疑”,事实上可能是大大的可疑。

    如果真要对付机器,我胡乱想了两个办法:

    1.与其你一个人,你需要小伙伴的加入。由于每个人无意识偏爱的数字不同,本应异常明显的伪造者的爱好被平均了。

    2. 与其你一个人苦思冥想的写啊写,不如利用计算机生成的随机数字吧。但是采用计算机生成的随机数字,并不一定能达到你的目的。

    即使如此,因为计算机同时进行多种算法检测,愚弄计算机还是非常的困难......所以,我们打消这些小念头吧。


    Naive呀,英达先生。46.4万分50次存入,每次上限少于1万元,说明这些钱几乎都是以9千多元的金额存入的。连着50次存入9000多元,这不是有点奇怪么?大多数人存钱,就算不是从1到9分布排列,但也不会连着50次都在9000多元吧。在大数据运算和监测如此快速的今天,这笔账被翻出来并不奇怪。

    事实上,书中有一个章节,就记述了本福特定理在美国国税和执法部门的运用。

    1920年代,物理学家本福特在纽约州一家通用电气公司效力,他发现,很多数据在首位数的分布并不平均,其中以1为最多。因为自然规律,这种分布适用于各类型的数据,但不适用于电话号码、邮编等人为规定平均分布的数值。

    之后,本福特定律被一个叫尼格里尼的学者在90年代发扬光大,其分析方法被执法机构、税务机构和私营部门广泛采纳。审计人员可以利用这一点来判断数据是真实可信的还是伪造出来的。

    天真的英达先生:如何利用统计学看懂财务欺诈

    早在1998年,纽约时报就曾报道,包括加利福尼亚州在内,美国好几个州的税务机构都使用以本福特定律为基础的检测软件。因此,利用计算机检测数据由来已久,只不过外行人没想到或者不理解而已。

    当然,也有很多正当理由使得首位数与本福特定律不符。不过还有次位数定理,此时检验前两位数便有作用,这会生成有100个矩形的直方图。这样不符合的几率就会大大的降低。

    在当今,白领犯罪的主要手段就是虚构数字,做假账,例如在销售数据上篡改数字,在申报单上做手脚。当人们捏造数字时,数字会出现可预测的模式,能够辨识出这些模式的人就能迅速核查财务数据的可信度。

    因此,英达先生事件并非偶然,而是一种必然。他心存侥幸心理,只不过是没有学过统计学,没有意识到数据的规律如此强大而已。

    书中后面还讨论安然的虚假年报,麦道夫捏造的收益率从数据上看是多么的不正常,例如,安然公司在2001年到2002年所公布的每股盈利数字就不符合本福特定律,这证明了安然的高层领导确实改动过这些数据。也多少教会你识破年报和公司财务数据中的伪造,在今日的A股市场大概也会很有用吧。

    有一本统计学书的封面上写着:“懂得统计学的人,运气都不会太差。”——确实如此。

    相关文章

      网友评论

        本文标题:天真的英达先生:如何利用统计学看懂财务欺诈

        本文链接:https://www.haomeiwen.com/subject/cnxawttx.html