美文网首页数据蛙数据分析每周作业
查看DataFrame中column值具体有哪些:drop_du

查看DataFrame中column值具体有哪些:drop_du

作者: 我住永安当 | 来源:发表于2020-10-13 22:42 被阅读0次

1、drop_duplicates()

DataFrame.drop_duplicates(subset=None, keep='first', inplace=False)
  • subset: 列标签,可选
  • keep: {‘first’, ‘last’, False}, 默认值 ‘first’
    first: 删除第一次出现的重复项。
    last: 删除重复项,除了最后一次出现。
    False: 删除所有重复项。
  • inplace:布尔值,默认为False,是否删除重复项或返回副本
data = pd.DataFrame({'A':['a','b','c','c'],'B':[1,1,2,2]})
print(data.A.drop_duplicates(keep='first'))
print(data.A.drop_duplicates(keep='last'))
print(data.A.drop_duplicates(keep=False))
image.png

此处不讨论其删除重复值的用法。

2、nunique()

如果只需要剔除重复值后,column中的值有哪几种,就可以使用nunique()


image.png

可以看到,A列的值有abc3个,所以这里返回3.

3、unique()

如果需要看到提出重复值后,columns中的值有哪几种,还可以使用unique()。


image.png

4、value_counts()

该函数可以对Series里面的每个值进行计数并且排序。


image.png

需要注意的是,如果有np.NaN,只有drop_duplicates()unique()可以予以显示。

image.png

相关文章

网友评论

    本文标题:查看DataFrame中column值具体有哪些:drop_du

    本文链接:https://www.haomeiwen.com/subject/svvbpktx.html