最近在练习专注力,这是我用来联系的第一本书,大概总耗时是4小时。这本书的观点很有意思,作者会讲很多商业故事来为自己的观点做铺垫,所以还是挺适合练习专注力和速读的。关于数据可视化的时候,我度了《数据可视化之美》,主要是讲述关于什么是数据可视化,如何进行数据可视化,对可视化讲的非常细节。这本书相对比较不太一样,更多是从商业的角度来讲述为什么要进行数据可视化,数据可视化的好处,以及数据可视化在大数据中的位置,从一个较为宏观的角度来讲故事。
Tableau是一家专职做数据可视化工具的公司,这样一家公司,在2013年的5月,于华尔街上市,得到了2.5亿美元的融资。在大数据如此广泛的今日,可能还有的人还没有停过数据可视化这个词,而早在五年前,便有人早早的看到了数据可视化的价值。
![](https://img.haomeiwen.com/i3979148/9cccf0ed9f9625f9.png)
动图无法上传,因此贴出网址)
上图便是滴滴用大数据描绘出全国400城24小时的出行热力变化图。通过动图的方式,可以看到人们出行的高峰时间、人们集中在哪些城市等等信息。数据可视化就是这样一种工具,通过可视化的方式,将大量的数据甚至是成PB级的数据,直观的展示给观众,不再只是一些枯燥的数据。
可以说,数据可视化降低了数据分析的门槛,即使观众不是统计学专家,不懂各种复杂的数学公式,也一样可以快速的从图中发现一些问题,探察到潜在的商业价值,从而帮助制定更好的商业决策。同时,数据可视化工具也降低了观众的学习成本,观众并不需要了解那些专业的统计学工具、建模工具,如Matlab等如何使用,也不需要回任何编程语言,只需要将数据连接上,通过托拉拽等方式,就可以很容易地构建出相对定制化的可视化图形来供其进行研究。
数据可视化为什么是大数据中重要的一环
大数据是当今非常炙手可热的话题。很多公司通过正当或非正当的手段将一些用户数据收集起来据为己有,之前蚂蚁金服闹的沸沸扬扬的用一个很扯的年度关键字来诱使用户同意其收集数据就是一个很好的案例。关于数据的产生,这几年随着互联网的发展越发的快速了起来,曾有统计显示,全球数据量正以平均年增长率50%的速度在增长着,而当前数据总量的80%都是最近两年产生的。由此可见,现在正是数据的时代。
面对如此庞大的数据量,如何利用是一个关键。大数据可以做很多事,例如预测、推荐引擎等,而在这之前便是方向和目标的确定。这就是数据可视化的目的。借用Tableau的目标:
- 使数据能被更好地理解
- 与其他工具一道,使企业能够把握不断增长的数据流
- 促进数据发现
- 帮助人们进行更好地决策
![](https://img.haomeiwen.com/i3979148/20d803e91e6a140d.png)
大数据是把双刃剑,用好了可以造福用户,如自动驾驶、阿尔法狗都是人类智慧、机器智能和大数据的结晶,而如果用不好,其实就是对资源的浪费和对个人隐私的侵犯,如携程滴滴的杀熟、棱镜门事件都是很好的佐证。借用狄更斯的话:
这是最好的时代,也是最坏的时代;这是智慧的年代,也是愚蠢的年代;这是信仰的时期,也是怀疑的时期;这是光明的季节,也是黑暗的季节;这是希望的春天,也是失望的冬天;大伙儿面前应有尽有,大伙儿面前一无所有。
数据可视化与报表
对于数据可视化这个词以及数据可视化工具与报表和传统的报表工具如Excel、PPT有什么区别呢?确实二者有很多相似之处,而且很多数据可视化的展示就是静态报表。然而数据可视化很重要的一点在于其交互性,如上面滴滴的例子,通过动态的方式来展示,相较于静态的报表涵盖的信息量更大,讲的故事也多。
如Excel等的报表工具在现在也依旧很好的工具,但是相较于数据可视化工具来说,其数据来源更加单一,可展示的数据量也有很大的限制。数据可视化工具可以直接与用户的数据库相连,可以更高效的达到数据展示的目的,同时很多工具还支持分布式工具如Hadoop等。
不过想提一个个人观点,数据可视化工具虽然具备很大的优势,但并不是必需品。如果一个企业的数据没有达到一定量级,数据没有较大的复杂性,或许使用数据可视化工具是个良好的开端,但并不一定会被持续使用,毕竟Excel就可以很好的达到其目标。不能被持续使用的工具,学习使用它或许只是对时间的浪费。
不是银弹
数据可视化是大数据中重要的一环,是帮助企业更好地利用数据进行商业决策的一个步骤。然而数据可视化并不是银弹,其强烈依赖对于受众的良好把握、真实有效的大数据的支撑、良好的可视化设计以及其他一些因素。
把握好受众
天下并不存在放之四海皆准的真理,数据可视化也同样如此,并非所有的数据可视化都面向同样的手中,对于某一群手中起作用的可视化对于另一群手中未必起作用。因此把握好手中非常关键。
真实有效的数据支撑
英国数学家和发明家Charles Babbage曾说,
利用不充分数据印方的错误更甚于那些完全不用数据的错误
真实有效的数据支撑是利用数据可视化进行决策非常重要的一个前提。利用书中的一句话,数据可视化和大数据只是增加了做出更优决策和实现更大成果的机会而已,更重要的是,可视化并不代表“绝对的”和“永恒的”真理。数据可以操纵我们,混淆我们,也可以导致糟糕的决策。
良好的可视化设计
援引《英国卫报》数据记者John Burn-Murdoch的话:
即使简单如配色也会对可视化所呈现信息的可信度感知造成显著影响--通常这种影响较数据源的真实权威性还更强烈。
良好的可视化设计可以帮助用户更好的理解数据,从而制定明智的决策。而糟糕的设计,则会混淆用户的感知,将信息完全掩盖住,使用户制定糟糕的决策。
网友评论