在介绍tableau之前,我们先看一个示例:
从网上download一份2016年全年北京市空气质量的数据,做了一个可视化的图表,看图:

通过上图我们可以清晰的看到2016年全年北京市的空气质量情况,细致观察后我们发现,2016年12月差不多有半个月的时间里北京市处于重度以及严重污染的状况。(ノへ ̄、)捂脸
图片来自hooly'mac
以上就是使用tableau花费不到5分钟完成的一份可视化的数据图表。如果你已经对tableau产生了兴趣,那么我们就来具体聊一下吧~
what is tableau?
Tableau Software帮助人们查看并理解数据。帮助你快速分析、可视化并分享信息。
why tableau?
当今社会,商户智能(Business Intelligence,BI)被广泛应用各个行业,并在辅助商业决策方面发挥了重大的作用。但是传统的BI架构在处理企业数据时候有很多的弊端:
开发难度高,上线周期长
架构笨重,无法灵活响应
运维成本高
而tableau是一款定位数据可视化敏捷开发和实现的商务智能展现工具,具有以下核心优势:
数据获取极速高效
用户体验良好且易用的表现形式
易学,不需要技术背景和复杂的统计知识
操作十分简单
what can tableau do ?
我们继续来看几组很cool的可视化数据图表,来深入了解下tableau能为我们展现什么
NO1.第 113 届美国国会投票记录-每个Question下投票记录数
数据下载地址:https://public.tableau.com/zh-cn/s/resources

当然,你也可以使用饼状图来表示:

NO2.1910年美国各个州出生婴儿数
数据下载地址:https://public.tableau.com/zh-cn/s/resources

上图的原数据我们可以看一下,数据字段:美国州名、婴儿性别、出生年月、数目

值得一提的是tableau可以自动识别某一些地理位置的编号,以及日期类型的格式:d=====( ̄▽ ̄*)b厉害

1910年~2012年各个州出生的男女婴儿数目:在每个州出生的所有婴儿里面,我们用颜色标识了男女性别的婴儿。

接下来,1910年~2012年美国全国男女婴儿出生数目情况:

由上图我们看出,从1920年开始,女性婴儿的数目开始和男性婴儿数目拉开差距,且到1970年左右,差距越来越大。(484可以说美国人真的好重男轻女~(ノへ ̄、)捂脸)
其实tableau可以做的图标形式还有很多很多,以上我简单的列举了几种比较常用的。后面我们说下tableau实践部分:
tableau界面介绍:

数据窗口:展示当前使用的数据源,以及数据源包含的所有数据字段。在这里我们看到所有数据字段被分为两类:维度和度量(敲黑板)。
维度和度量是tableau使用过程中最重要的两个概念。
度量:往往是一个数值字段,将其拖放到功能区时,tableau默认会进行聚合运算,同时,试图去会战胜相应的轴;
维度往往是一些分类、时间方面的定性字段,将其拖放到功能区时,tableau不会对其进行字段,而是对视图区进行分区,维度的内容显示为歌曲的标题。
离散和联连续:
离散和连续是另一种数据角色分类,在tableau中,蓝色是离散字段,绿色是连续字段,离散字段在行列功能区总是在视图中显示为标题,而连续字段则在试图中显示为轴:
连续:

离散:

写到这里,我们来回到文章的最初,讲一下北京市空气质量情况的可视化图表是如何完成的。
tableau示例详解:
先看一下原始数据:

step1:导入数据:

step2:分析下我们想要的最终效果,我们需要在维度上按照季度和月份、以及天分类,而度量则是我们最终需要看的数据:空气质量也就是AQI指数。

step3:于是我们做如下操作:
讲日期拖到列标签、行标签(拖两次),将日期单位分别置为:日、季度、月,然后选择智能显示中的第二个图表类型

step4:发现和我们最终想要的还有一些差距。我们希望使用颜色来表示不同的污染程度,将AQI指数拖动到颜色上。同时我们不希望AQI对放块儿的大小起作用,于是我们把形状上的AQI指数去掉

step5:同时我们不希望AQI对放块儿的大小起作用,于是我们把形状上的AQI指数去掉:

step6:这时候我们需要改变方块儿的颜色:
这里根据我们队污染程度区间的定义:0~50:优;50~100:良;100~150:轻度污染;.....等
我们需要对AQI空气指数进行分组:

step7:分组完成

step8:我们把AQI在颜色上的标记去掉,把刚刚的AQI分组拖到颜色标记上:

step9:oh,好像差不多了,只是颜色还有点诡异,没关系,我们改一下颜色:


step10:我们给每个组分配上不同的颜色,使其更好区分污染程度。然后点击工作表-复制-图像:

啊哈,完成!

如果您对tableau感兴趣,还可以看我另外文章:
网友评论
全球恐怖袭击:http://t.cn/R4cEqoE
雾霾天气分析:http://t.cn/ROIGBoC