美文网首页
数据会说谎系列

数据会说谎系列

作者: LucasX | 来源:发表于2017-07-07 22:08 被阅读25次

大数据时代,数据分析无疑是当今最热门的职位之一了,当你看见一张张漂亮的可视化图表的时候,你可要保持清晰冷静的头脑了,说不定这是数据分析从业师对你施加的Tricks来迷惑你的呢~

本文就向大家介绍一下数据分析与可视化过程中常见的 “数据会说谎” 系列。
  1. 时间序列数据的区间选取
    设想一下,你想写一份数据分析报告用于佐证你的观点时,而又苦于无法寻找强有力的支撑点时。不妨换一换思路,你可能会得到额外的收获。

    案例如下:你打算为你的观点 “奥巴马政府比布什政府在就业方面做了更多努力” 提供数据说服力时,若仅仅取近几年的数据,那么我们会得到如下的统计图表:


    image.png

    由于视觉的信息传达要比文字更多更高效,因此当看到这张图时,我想大多数人都会认同 “奥巴马政府在促进就业方面比布什政府做得更好” 这个观点了。(小提示:在统计图表下方标注官方、权威的数据来源,会使得你的数据分析报告更具备说服力!)

    然而,当我们把时间区间扩大,就会得到如下的统计图表:

image.png

此时,上述观点就不具备说服力了。
好好 “利用” 时间序列数据的天然属性,往往能解读出不同的观点,这是今天谈到的第一个“数据会说谎”例子,记住了吗~

  1. 坐标原点的选取
    设想一下,如果你想表达 “某APP自从上线以来,用户数量飙升” 这个观点时,我们来看一下选取 【不同坐标原点】时,图表是如何 “欺骗” 我们双眼的。
    当我们将Y轴坐标原点设置为10,就会得到如下的折线图(是不是显得 “增势喜人”?):


    image.png

    然而,当我们将Y轴坐标原点设置为0,就会得到如下的折线图(是不是看起来增长数量停滞了?):


    image.png

    因此,选择【不同的Y轴坐标原点】,可能带来完全相反的观点解读!

  2. 选择不同的表现形式
    设想一下这样的场景:A公司当前本季度销售额为120万,上季度销售额为100万;B公司当前本季度销售额为1100万,上季度销售额为1000万。
    若按照【增长率百分比】来计算,则A的增长率为20%,B为10%。若将该数字生成图表,此时的视觉效应则更加明显:


    image.png

    若按照【增长数量】来计算,就会得到下面的结果:

image.png

相关文章

  • 数据会说谎系列

    大数据时代,数据分析无疑是当今最热门的职位之一了,当你看见一张张漂亮的可视化图表的时候,你可要保持清晰冷静的头脑了...

  • 《统计数据会说谎》读书笔记

    wordrepss原文链接:《统计数据会说谎》读书笔记 《统计数据会撒谎》 how to lie with sta...

  • 几个“数据会说谎”的真实例子

    数据解读是数据分析最重要的环节,数据不会说谎,说谎是来自于数据误读;很多公司招聘数据分析只强调数据处理,对数据解读...

  • 数据不会说谎,但人会

    我一直在阅读各种2016的基准趋势。邮箱服务分发和参与的发展趋势看上去都不错。但这些典型的数据分析并不能打动我。我...

  • 数据会说谎?

    还记得刚开始做「报告型 PPT」时,看到知乎有答主以上图的例子说明,当 Y 轴设定不同的最小值时,可以得到「更有利...

  • 数据会说谎

    大数据时代,人们都很喜欢用数据说话,但是,数据表现出来的只是事情的结果,并不是事情的真相,比如最近的支付宝2016...

  • 数据会说谎

    分享一个项目中的实际经历: 18 年的时候,我们在做一个微信生态下游戏聚合平台的项目。里边会涉及到很多图片素材的设...

  • 数据不说谎

    本来是作为不用过脑甚至不认同的态度看各个问题的讨论因素与结论的,权当无聊的读物,本该无趣无情的数据却最终读出了心酸...

  • 三个数据分析里最难攻破的“悖论”,每一个都令人费解

    跟数据打的交道越多,就越可能对数据产生绝对的信赖感,但其实在实际业务中,数据往往会“说谎”,今天给大家介绍三个数据...

  • 致读者

    我们会犯错,我们还会说谎。犯了错后,不敢承认错,就会说谎,然后为了圆谎而继续说谎。说谎,是人的天生本领;犯错,...

网友评论

      本文标题:数据会说谎系列

      本文链接:https://www.haomeiwen.com/subject/xzblhxtx.html