美文网首页R
统计数据可视化工具包:Seaborn

统计数据可视化工具包:Seaborn

作者: LabVIEW_Python | 来源:发表于2021-02-13 08:45 被阅读0次

    什么是Seaborn?Seaborn是基于matplotlib的,面向统计数据可视化的,拥有更加好用易用的高抽象级别封装API的Python工具包。在做数据研究、分析和建模的时候,先把数据可视化,可以帮助你更好的探索和理解数据。

    Seaborn接受的数据类型是:Pandas的dataframe和Numpy的array

    Seaborn的显示函数分为三类: “relational”, “distributional”, and “categorical” Seaborn的显示函数

    Seaborn最常用的函数是displot,即可视化数据分布方式,通过观察数据分布方式,可以了解到数据的主要趋势是什么?它们是否严重偏向一个方向?是否有双峰证据?有明显的离群值吗?先从一个最简单的范例说起

    import numpy as np
    import matplotlib.pyplot as plt
    import seaborn as sns
    import pandas as pd
    
    np.random.seed(0)
    height = np.random.uniform(low=150, high=190, size=1000).reshape(-1, 1)
    weight = np.random.normal(loc=70, scale=10, size=1000).reshape(-1, 1)
    data = np.concatenate((height, weight), axis=1)
    df = pd.DataFrame(data, columns=['height', 'weight'])
    
    sns.set()  #切换到sns的默认运行配置,不切换图像就很丑
    sns.displot(data=df)
    plt.show()
    
    全默认设置
    • 参数kde (kernel density estimate,核密度估计),控制是否显示kde
    sns.displot(data=df,kde=True)
    plt.show()
    
    kde=True
    • 参数kind指定:“hist”:直方图;“kde”:核密度估计; “ecdf”:“hist”, “kde”, “ecdf”: 累积分布函数 参数kind
    • 查看两个变量之间的关系

    sns.displot(data=df, x='height', y ='weight',kind='kde')
    
    查看两个变量之间的关系

    Seaborn还有其它函数,参考上述方式,一边学习,一边测试即可。

    相关文章

      网友评论

        本文标题:统计数据可视化工具包:Seaborn

        本文链接:https://www.haomeiwen.com/subject/kbcsxltx.html