计算缺失的数据
应用条形图的一个有趣方式是可视化缺失的数据。我们可以使用 pandas 函数创建一个标签,每列包含缺失值的数量。
df.isna().sum()
image.png
如果我们想可视化这些缺失的值计数呢?我们可以将变量名当做分类变量的级别,并创建条形图。然而,由于这些数据并不整洁,未经处理也未经归纳,因此我们需要使用另一个绘制函数。 Seaborn 的 barplot
函数旨在描述一个定量变量相对于另一个定量变量级别的直观状况,可以用在此处。
na_counts = df.isna().sum()
base_color = sb.color_palette()[0]
sb.barplot(na_counts.index.values, na_counts, color = base_color)
该函数的第一个参数包含 x 值(列名称),第二个参数包含 y 值(计数)。
image.png一般而言,如果你的数据已经过整理归纳并且你依然想要绘制条形图,那么该函数很有用。但是如果数据尚未归纳,则使用 countplot
函数,这样就不需要进行额外的归纳工作。此外,你将在下节课了解 barplot
的主要作用是什么,届时我们将讨论如何调整单变量图以绘制双变量数据。
网友评论