美文网首页
数据可视化

数据可视化

作者: 阿猫阿狗Hakuna | 来源:发表于2020-04-16 21:59 被阅读0次

    总结自《极客时间——数据分析课程》

    数据可视化分为以下9种情况:


    image.png

    一.可视化工具

    1.商业智能分析

    Tableau、PowerBI、FineBI

    2.可视化大屏

    DataV、FineReport

    3.前端可视化组件

    Web渲染技术:Canvas、SVG是html5中主要的2D图形技术,WebGL是3D框架。
    可视化组件:Echarts、D3、Three.js、AntV

    4.编程语言

    Python:matplotlib、Seaborn。

    二.Python可视化技术

    使用python进行数据分析,需要在开始时进行探索性的数据分析,了解数据。

    1.可视化试图的种类

    比较:比较数据间各类别的关系,或者是它们随着时间的变化趋势,比如折线图。
    联系:查看两个或两个以上变量之间的关系,比如散点图。
    构成:每个部分占整体的百分比,或者是随着时间的百分比变化,比如饼图。
    分布:关注单个变量,或者多个变量的分布情况,比如直方图。

    按照变量的个数,我们可以把可视化视图划分为单变量分析和多变量分析。

    (1)散点图
    image.png

    散点图的英文叫做 scatter plot,它将两个变量的值显示在二维坐标中,非常适合展示两个变量之间的关系。
    画散点图,需要使用 plt.scatter(x, y, marker=None) 函数。x、y 是坐
    标,marker 代表了标记的符号。比如“x”、“>”或者“o”。

    import numpy as np
    import pandas as pd
    import matplotlib.pyplot as plt
    
    N = 1000
    x = np.random.randn(N)
    y = np.random.randn(N)
    plt.scatter(x, y, marker='x')
    plt.show()
    
    (2)折线图

    折线图可以用来表示数据随着时间变化的趋势。
    Matplotlib 中,我们可以直接使用 plt.plot() 函数,当然需要提前把数据按照 x 轴的大小进行排序,要不画出来的折线图就无法按照 x 轴递增的顺序展示。

    import matplotlib.pyplot as plt
    
    x = [2010, 2011, 2012, 2013, 2014, 2015, 2016]
    y = [5, 3, 6, 20, 17, 16, 19]
    plt.plot(x, y)
    plt.show()
    
    (3)直方图

    在 Matplotlib 中,我们使用 plt.hist(x, bins=10) 函数,其中参数 x 是一维数组,bins 代表直方图中的箱子数量,默认是 10。

    import numpy as np
    import pandas as pd
    import matplotlib.pyplot as plt
    
    a = np.random.randn(100)
    s = pd.Series(a)
    plt.hist(s)
    plt.show()
    

    相关文章

      网友评论

          本文标题:数据可视化

          本文链接:https://www.haomeiwen.com/subject/ukrjvhtx.html