美文网首页
干货 | 大数据是怎么坑人的

干货 | 大数据是怎么坑人的

作者: 如故实验室 | 来源:发表于2017-04-26 19:28 被阅读0次

    作为一个用大数据支撑心理学的实验室,我们「如故实验室」很少吹自己在大数据上有多牛逼。因为,我们认为在研究人类终极幸福的道路上,肯定有踩不完的坑,是大数据没法轻松搞定的。我们有时候也很羡慕其他自称“以大数据而闻名”的同行,好想问问:你们为什么敢吹各种各样的牛逼?

    那么大数据到底可以有多不靠谱呢?让行业人带你逛一逛。

    如故实验室的老李还年轻的时候,经常听人吹一个啤酒和尿布的故事。美国某咨询公司的数据科学家,研究了沃尔玛超市顾客的购买记录,发现顾客经常同时购买尿布和啤酒。他们因此得出结论:男性顾客会因为照顾婴儿而闹心,因此会买啤酒来犒劳自己。

    这家咨询公司拿着大数据研究结果向沃尔玛建议,将啤酒和尿布的架子放在一起,就可以提高销售量到三倍。

    沃尔玛看完后说:

    那么请问你有见过任何一个超市将啤酒和尿布放在一起吗?

    事实上,啤酒和尿布对于北美家庭都属于高消耗品,同时购买的几率非常高。啤酒和纸巾也会经常被同时购买,纸巾和尿布也会被同时购买。消费者并不会因为超市将他们放得远就不买了。

    所以呢,真实的结论就是,只要是高消耗日用品都会被同时购买,和是否放在一起并没有关系,和数据挖掘更是没有半毛钱关系。

    “但是养猫和单身可能真的存在一定关系呢。”老李暗自哭泣道。

    如故实验室的小胖,在网上闲逛看到一则新闻:

    牛逼啊!上海交大果然人才辈出!个个都是高到不知道哪里去的人才!

    该教授运用大数据技术,检测了1856张中国成年男子面部照片,结果发现,罪犯与常人的面相存在显著差距——平均来讲,罪犯的内眼角间距要比普通人短5.6%,上唇曲率大23.4%,鼻唇角角度小19.6%。

    这么港,“相由心生”获得了科学证明啊!记者也生怕搞不出大新闻,问教授是否因为受到很多攻击。教授表示很委屈,说自己本来打算证伪的,没想到却搞出这么个结果。

    但是实际上呢,实验中使用的数据集(730名罪犯,1126名非罪犯)上,仍有10%的误报率。这意味着用这个理论来判断,将有73名罪犯被漏掉,有113名非罪犯被冤枉。这样的准确率也太呵呵了吧。

    另外,数据集有极大的偏差,从街上随便拉1000个人,可能一个逃犯都没有;然而教授的数据集里,竟然有接近一半都是罪犯。所以在实际中,用这个模型来判断罪犯,估计会很惨烈。

    然而这个鸡肋的研究,还是让众多“国(mian xiang)学”爱好者集体高潮了:


    有些时候就算做研究也要想下社会影响啊喂……

    在人脸识别上,人类已经有很多进展了。人类的科技先锋Google在Google

    Photos引入了人脸识别功能,可以自动将你的照片分类,归入不同的场景。只是……

    他们将黑人用户认成大猩猩了:


    美剧《傲骨贤妻》给出了一个可能的解释:Google在训练人像识别的数据库中,包含的黑人头像太少,导致模型不能有效分辨别黑人的长相。这中间可能有研发人员的偏见和歧视,比如说他们在建立数据库时,并没有考虑放入黑人的头像。

    在统计学发展多年后人们发现,证实事物之间的因果关系,是件几乎不可能的事。所以呢,大家开始通过“相关性”来解释“因果关系”。所以身在大数据时代,我们不要看到“数据”,“百分比”,“成功预测”,“模型”这些大数据咒语就高潮了,而应该比过去更具备批判的思维。

    很多人说自己对另一半最关注的就是颜值。但是,在如故实验室的实际研究中,我们却发现大家对颜值的要求很不一样:有些人只是觉得颜值是门槛,看得过眼就好;有些人则是纯粹追求高颜值,但是欣赏完了就OK,并不会有下一步;有些人则是疯狂崇拜颜值,觉得不和最漂亮/最帅的在一起就浑身难受。

    但是在我们研究感情稳定、相伴多年的夫妇或情侣时,却发现帅哥美女的组合实在是太!少!了!真正让两个人能坚持在一起的原因是「三观相合」。因此,我们开发了基于三观匹配的交友软件「如故App

    市面上的大部分社交App都是基于颜值进行推荐,说白了,就是用户X因为被其他众多用户“喜欢”了,于是他们将用户X推荐给你,因为你有很大概率也会“喜欢”X。这就跟淘宝爆款一样,人人都喜欢,所以系统觉得你也应该喜欢。

    但是你真的喜欢淘宝爆款吗?

    <彩蛋!测试环节>

    想试试你会不会被大数据蒙骗?如故实验室的小淘气老李给大家出几道测试题,请判断以下论证是否正确:

    1)挪威的游客数增多的同时,蚊子数量也会增加。因此,是游客将蚊子带到挪威。

    2)大多数犯罪都发生在夜晚,所以是月亮使人犯罪。

    3)在美国,谋杀率随着IE浏览器使用量下降而下降,说明IE浏览器促使人谋杀。

    4)美国佛罗里达的新生儿数量最多的是拉丁裔,而死亡人数最多的是犹太人。所以,佛罗里达政府一定在秘密地将拉丁人转变成犹太人!

    5)巧克力的人均摄用量和该国诺贝尔奖得主数量高度相关,说明食用巧克力有助于提高国民科学素养。

    6)电竞解说黄旭东多次在赛事解说中说谁赢就谁输,在国足与韩国队之前预言国足必败,最终32年对韩皆败的国足,以1:0击败韩国队。因此,黄旭东真的是“毒奶”。

    “最后一个绝对是因果关系!!!”说到这里,老李很激动。

    相关文章

      网友评论

          本文标题:干货 | 大数据是怎么坑人的

          本文链接:https://www.haomeiwen.com/subject/ardwzttx.html