美文网首页
Python 清除重复值

Python 清除重复值

作者: 正在充电Loading | 来源:发表于2017-08-17 10:06 被阅读0次

    from pandas import read_csv

    df = read_csv('D://PDA//4.3//data.csv')

    df

    df表

    #找出行重复的位置

    dIndex = df.duplicated()

    #根据某些列,找出重复的位置

    dIndex = df.duplicated('id')

    dIndex = df.duplicated(['id', 'key'])

    #根据返回值,把重复数据提取出来

    df[dIndex]

    id  key          value

    4  1251147    品牌          Apple

    5  1251147  商品名称  苹果iPad mini 3

    #直接删除重复值

    #默认根据所有的列,进行删除

    newDF = df.drop_duplicates()

    #当然也可以指定某一列,进行重复值处理

    newDF = df.drop_duplicates('id')

    相关文章

      网友评论

          本文标题:Python 清除重复值

          本文链接:https://www.haomeiwen.com/subject/fvrgrxtx.html