美文网首页经验App:聚合职场优选内容工具癖高效工作
10分钟做一个高端数据可视化,看完你也会!

10分钟做一个高端数据可视化,看完你也会!

作者: 数据分析不是个事儿 | 来源:发表于2019-04-25 16:03 被阅读80次

    其实,本文就是想分享一个做可视化的捷径!

    制作可视化的方式有千千万。

    Excel控若能轻车熟路驾驭VBA,能玩出各种花来,再不济借助图表插件外援也能秒杀一众小白选手。

    会编程的,Echarts几十行代码,分分钟出秀;R语言玩得一手数据挖掘,可视化自不在话下;Python爬数据达人,手握matplotlib包打天下。

    这么多工具,从哪个入手较好?这也是很多人犯难的。

    其实,数据分析大家大可不必垂涎于工具。对于绝大多数的我们,需求在于从万千数据中统计出一些规律,或者某些业务问题想通过分析数据的方法得到求证。

    分析工具更多的价值在于辅助分析过程中数据的处理,能够将结论以可视化的方式直观展,最终解决问题。如果在功能上能做到避免写公式写代码,易上手易用,那就更好了

    笔者一直主张用BI分析,于数据分析师,节省时间提高效率。于入门,BI也是最简单最好上手的可视化分析工具。

    之前分享了《这可能是今年最值得推荐的数据分析工具》,讲解了FineBI的主要功能、特点和基本使用方法。

    依照承诺,要分享一个实操类的文章。

    所以今天想着重于数据分析的过程,来手把手教大家制作一个可视化报表。

    PS:其实可视化报告真的不难,只要有一些分析基础,外加掌握1~2个工具即可。

    为了更好的帮大家上手实践,文尾公开了数据源及报告展现地址,供大家学习和练习。

    一、数据分析的操作思路

    数据分析通常是这样切入的,比方说业务上发生了变化,流量下降20%,那么我们就要分析可能的原因,需要多方数据去验证假设。又或者拿到一份数据,思考可以分析的规律点。无论哪种情况,一个完整的数据分析都需要经历数据获取、数据预处理、数据分析与建模、可视化分析及报告撰写的过程。

    FineBI这个BI工具的功能模块也是依据分析的流程来设计的,分为数据连接、数据准备、可视化分析、仪表板驾驶舱、分享仪表板等。

    二、认识这个工具——FineBI的工作区

    官网安装好合适的版本,成功激活,设置初始账号密码后,会跳转到这个web页面。

    左侧是导航栏,类似于菜单栏。目录类似首页,展现已完成的分析报告,这里默认展现官方的内置demo。

    数据准备是连接数据、准备数据,以及对数据进行再加工处理的地方,可进行业务包、数据表、关联、多路径、数据更新、自助数据集等管理。

    仪表板即创建可视化分析。管理系统即对整个数据决策系统进行管理的地方,包括目录的设置、外观设置、数据、报表、分享权限等管理配置。

    创建是提供给用户快捷新建数据连接、添加数据库表、添加SQL数据集、添加EXCEL数据集、添加自助数据集、新建仪表板的地方。

    三、连接/导入数据

    制作数据报告,第一步是导入数据,FineBI能从很多种数据源导入数据:如Excel,CSV,XML,以及各类数据库(SQL Server,Oracle,My SQL等),两大主流开源平台(Hadoop,Spark)等等。最常用的方式是连接数据库和导入excel数据。两种方式因为最常用,所以这里都演示操作一遍。

    1、数据库连接举例:连接mysql

    2、导入excel数据

    同样的数据,用一份excel导入。

    第一步:数据准备—添加业务包,业务包是用来统一整理数据表的。这里创建一个台风数据包。点击添加表,新建excel数据集。

    就得到如下的数据明细。这里可以自动识别数据的字段类型,也可以修改字段类型。(举例:有些情况下将时间识别成文本类型,需要手动切换成时间类型,不然会影响后续操作)

    至此,数据就导入成功。

    四、数据塑性—自助数据集

    自助数据集其实是数据加工的环节。一般我们拿到的数据往往是有空缺值有重复,所谓脏数据,脏数据需要清理,关于数据清洗的处理可以写5000字篇,这里就不多讲了。更常见的情况是分析中需要新建一些字段,这是源数据所没有的。这时候就可以根据需求对原数据进行再加工处理,新建一个用于分析的数据集。再处理的操作包括:选择字段、过滤、分组汇总、新增列、字段设置、排序、左右合并、上下合并、挖掘。

    这里因为分析的比较简单,且原始数据已经很规范,所以暂时还不需要对源数据表进行这些操作,且一些过滤操作可以放到后面创建分析图表的过程中去做。

    其实,在自助数据集之前,有个功能没讲到。FineBI有个管理员的说法,这在企业部署中会涉及。管理员可以给不用人分配不同权限下的数据,比如财务的只能看财务和销售的数据,或者一部分财务人员只能看到特定的业务包里的数据,或者部分数据表,这些都是出于数据安全以及流程管理考虑。在管理员准备好数据后,就可以分配给不同人员账号,以及部分权限的数据。如果是个人使用,比如本文所要介绍的分析,BI系统是部署在自己本地的,那自己就是管理员,拥有最高权限。本文的分析暂时不需要用到权限功能,这里只做简单介绍。

    五、可视化分析

    到这里数据准备好了,接下来开始正式分析。

    先来观察这份数据,这份数据是我从网上当下来的,展示了1945年——2015年登陆我国的台风信息,包括时间、登陆省市以及台风强度。

    那么我们可以汇总统计下历年来台风最常光顾的省份和城市有哪些,一年中哪个时间段是台风频发日,以及台风强度分布。

    1、 新建仪表板,即我们说的可视化报告、dashboard,叫法很多。

    2、 新建可视化组件,添加刚刚导入的数据集。(图表、查询筛选框等都叫组件,是finebi仪表板的组成元素。)

    分析1:各年度登陆我国的台风数量

    添加完数据集会进入到这个分析界面。拖拽要分析的字段(记录数—统计台风数量的指标,登陆时间——这里只展示年份这个维度)

    这里要注意,源数据表中一个台风有多行记录,那是因为台风可能同时登陆两个区域,记录了两条信息,所以记录数要依赖CMA编号统计(记录数右侧小三角下拉),以免重复。

    其次,这里又添加了一个统计每年台风平均数的指标。

    最后再对次图表稍加美化,通常在图形属性和组件样式中:

    ① 修改线条颜色:图形属性—颜色

    ② 修改连线为平滑曲线,并且可调整有无标记点

    ③ 修改该组件标题:组件样式—标题,可调整字体样式

    最终得到如下成图:

    能明显感觉到登陆我国的台风呈现一个2~4年的波动变化,且2000年以来,直击我国的台风整体数量有略微下降。

    分析2:台风登陆各省沿海城市分布—数据地图

    这里演示一下数据地图的制作,用地图直观展现台风登陆我国沿海各省市的分布。

    必须将维度创建成地图角色,生成经纬度。

    匹配好数据后生成省份(经度)、省份(纬度)字段。这里要注意检查一些匹配是否正确,我就遇到把辽宁省匹配成宁夏的bug,匹配有问题可以随时调整。

    然后将字段分别拖至横轴和纵轴,会自动生成一个填充地图。除此之外还有点地图、热力地图等,这里就用填充地图举例。

    填充地图顾名思义,就是用区域的颜色区分数值大小。这里将记录数拖拽到图形属性-颜色,即可看到区分,(颜色可在下拉框中自行选取)。再将记录数拖拽到标签,即可显示登陆该省市的台风数量。

    在组件样式——背景中,可以修改GIS地图样式,如下:

    注:关于图表组件的样式,比如标题名(字体大小颜色)、轴线、配色,图表布局等都可在图形属性和组件样式中选择。选项非常多,请读者们自行发挥自己的美学天赋吧!关于数值的计算、过滤排序等操作,都可在横轴、纵轴的指标维度下拉框中找到。

    六、可视化报告

    其他分析大同小异,篇幅有限,以上只举了两个例子。

    图表分析组件完成之后,就是构建可视化报告(dashboard)了。

    仪表盘样式中有预设的模板可以直接套用,以下是笔者随便套用的一个模板,更具模板的风格,后面调整了每个图表的样式和配色。好不好看全看个人审美了。

    小结

    总的来说,使用FineBI制作可视化报表,最关键的还是在于数据处理,数据处理好了,报表绘制起来才能得心应手。由于数据之前在excel里已经做了一些处理,所以拿到的数据基本可以直接上手分析。

    在充分掌握了数据处理技巧后,就可以将更多精力放在各种各样的可视化图形上。FineBI内置了很多配色及风格,接下来大家可以尽情发挥自己的想象力制作各种酷炫的可视化报表,尽量搞清楚可视化制作中所有内置图形的绘制方法,以及样式调整。

    最后,码了好久,求大家点赞支持!

    附资料:

    1、FineBI 下载:5.1不限期试用版(我和官方申请来的)

    2、源数据

    Mysql数据源

    URL:jdbc:mysql://192.168.0.108/a

    用户名:root

    密码:123456

    Excel文件:https://pan.baidu.com/s/15qOxkVDvDPLE2d83jDot2A

    相关文章

      网友评论

        本文标题:10分钟做一个高端数据可视化,看完你也会!

        本文链接:https://www.haomeiwen.com/subject/kiezgqtx.html