总结自《极客时间——数据分析课程》
数据可视化分为以下9种情况:
image.png
一.可视化工具
1.商业智能分析
Tableau、PowerBI、FineBI
2.可视化大屏
DataV、FineReport
3.前端可视化组件
Web渲染技术:Canvas、SVG是html5中主要的2D图形技术,WebGL是3D框架。
可视化组件:Echarts、D3、Three.js、AntV
4.编程语言
Python:matplotlib、Seaborn。
二.Python可视化技术
使用python进行数据分析,需要在开始时进行探索性的数据分析,了解数据。
1.可视化试图的种类
比较:比较数据间各类别的关系,或者是它们随着时间的变化趋势,比如折线图。
联系:查看两个或两个以上变量之间的关系,比如散点图。
构成:每个部分占整体的百分比,或者是随着时间的百分比变化,比如饼图。
分布:关注单个变量,或者多个变量的分布情况,比如直方图。
按照变量的个数,我们可以把可视化视图划分为单变量分析和多变量分析。
(1)散点图
image.png散点图的英文叫做 scatter plot,它将两个变量的值显示在二维坐标中,非常适合展示两个变量之间的关系。
画散点图,需要使用 plt.scatter(x, y, marker=None) 函数。x、y 是坐
标,marker 代表了标记的符号。比如“x”、“>”或者“o”。
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
N = 1000
x = np.random.randn(N)
y = np.random.randn(N)
plt.scatter(x, y, marker='x')
plt.show()
(2)折线图
折线图可以用来表示数据随着时间变化的趋势。
Matplotlib 中,我们可以直接使用 plt.plot() 函数,当然需要提前把数据按照 x 轴的大小进行排序,要不画出来的折线图就无法按照 x 轴递增的顺序展示。
import matplotlib.pyplot as plt
x = [2010, 2011, 2012, 2013, 2014, 2015, 2016]
y = [5, 3, 6, 20, 17, 16, 19]
plt.plot(x, y)
plt.show()
(3)直方图
在 Matplotlib 中,我们使用 plt.hist(x, bins=10) 函数,其中参数 x 是一维数组,bins 代表直方图中的箱子数量,默认是 10。
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
a = np.random.randn(100)
s = pd.Series(a)
plt.hist(s)
plt.show()
网友评论