美文网首页Pandas数据分析我爱编程
pandas使用技巧【18】找到和移除重复行

pandas使用技巧【18】找到和移除重复行

作者: 夜雨寒山 | 来源:发表于2017-11-09 14:56 被阅读1435次
    简介: 本文介绍如何找到和移除重复行。
    1. duplicated()方法
    • 查看列是否重复
    dataframe.colname.duplicated()
    
    • 查看整行是否重复
    dataframe.duplicated()
    
    • 查看subset是否重复
    dataframe.duplicated(subset = [])
    
    1. drop_duplicats()方法
      用于丢弃重复项
    dataframe.drop_duplicats()
    
    1. 参数keep
      keep可以为first和last,表示是选择最前一项还是最后一项保留。
    dataframe.duplicated(keep = "first")
    dataframe.duplicated(keep = "last")
    

    也可以设置布尔类型,当设为False时候,重复项将都被显示。

    dataframe.duplicated(keep = "False")
    

    附上小哥哥的视频链接Data analysis in Python with pandas
    Youtube 🔗
    哔哩哔哩 🔗

    本系列文章列表
    pandas使用技巧总览

    相关文章

      网友评论

        本文标题:pandas使用技巧【18】找到和移除重复行

        本文链接:https://www.haomeiwen.com/subject/agopmxtx.html