美文网首页DATA ANALYSIS PROCESS
Matplotlib和Seaborn之计算缺失的数据

Matplotlib和Seaborn之计算缺失的数据

作者: IntoTheVoid | 来源:发表于2020-04-23 13:38 被阅读0次

    计算缺失的数据

    应用条形图的一个有趣方式是可视化缺失的数据。我们可以使用 pandas 函数创建一个标签,每列包含缺失值的数量。

    df.isna().sum()
    
    
    image.png

    如果我们想可视化这些缺失的值计数呢?我们可以将变量名当做分类变量的级别,并创建条形图。然而,由于这些数据并不整洁,未经处理也未经归纳,因此我们需要使用另一个绘制函数。 Seaborn 的 barplot 函数旨在描述一个定量变量相对于另一个定量变量级别的直观状况,可以用在此处。

    na_counts = df.isna().sum()
    base_color = sb.color_palette()[0]
    sb.barplot(na_counts.index.values, na_counts, color = base_color)
    
    

    该函数的第一个参数包含 x 值(列名称),第二个参数包含 y 值(计数)。

    image.png

    一般而言,如果你的数据已经过整理归纳并且你依然想要绘制条形图,那么该函数很有用。但是如果数据尚未归纳,则使用 countplot 函数,这样就不需要进行额外的归纳工作。此外,你将在下节课了解 barplot 的主要作用是什么,届时我们将讨论如何调整单变量图以绘制双变量数据。

    相关文章

      网友评论

        本文标题:Matplotlib和Seaborn之计算缺失的数据

        本文链接:https://www.haomeiwen.com/subject/hrrnfqtx.html