美文网首页R语言
drop_duplicates 去重失败

drop_duplicates 去重失败

作者: 你说我对钱一往情深 | 来源:发表于2018-12-28 17:41 被阅读36次

    drop_duplicates用法:

    #去除data中a,b两列均重复的行,并保留最后一个
    data.drop_duplicates(['a','b'],keep='last')  
    #去除所有列都一样的行
    data.drop_duplicates() 
    

    关于失败:

    data.drop_duplicates(['a','b'],keep='last')  
    print(data)
    

    这个时候我发现原本的data里还是有重复的数据,,好气

    解决方案:

    data.drop_duplicates(['a','b'],inplace=True)  
    print(data)
    

    原因:drop_duplicates(inplace=True)是直接对原dataFrame进行操作。
    drop_duplicates(inplace=False)是重新创建一个新的DataFrame并进行删除,对原DataFrame不进行改变。

    相关文章

      网友评论

        本文标题:drop_duplicates 去重失败

        本文链接:https://www.haomeiwen.com/subject/spselqtx.html