美文网首页R语言
drop_duplicates 去重失败

drop_duplicates 去重失败

作者: 你说我对钱一往情深 | 来源:发表于2018-12-28 17:41 被阅读36次

drop_duplicates用法:

#去除data中a,b两列均重复的行,并保留最后一个
data.drop_duplicates(['a','b'],keep='last')  
#去除所有列都一样的行
data.drop_duplicates() 

关于失败:

data.drop_duplicates(['a','b'],keep='last')  
print(data)

这个时候我发现原本的data里还是有重复的数据,,好气

解决方案:

data.drop_duplicates(['a','b'],inplace=True)  
print(data)

原因:drop_duplicates(inplace=True)是直接对原dataFrame进行操作。
drop_duplicates(inplace=False)是重新创建一个新的DataFrame并进行删除,对原DataFrame不进行改变。

相关文章

网友评论

    本文标题:drop_duplicates 去重失败

    本文链接:https://www.haomeiwen.com/subject/spselqtx.html