pandas 2

作者: chliar | 来源:发表于2018-10-24 14:30 被阅读0次

    DataFrame 删除相同的(即包含)可以用去重的方法

        df1 = pd.DataFrame([[1, 2], [4, 6]], columns=['a', 'b'])
        df2 = pd.DataFrame([[1, 2], [4, 6], [5, 5]], columns=['a', 'b'])
        df = df2.append(df1)
        print(df)
        print('*' * 50)
        df = df.drop_duplicates(subset=['a', 'b'], inplace=False, keep=False)
        print(df)
    
    结果
    >>>
           a  b
        0  1  2
        1  4  6
        2  5  5
        0  1  2
        1  4  6
        **************************************************
           a  b
        2  5  5
    keep=False 不保留相同的值
    keep = 'first' 保留排在最前的相同值
    keep = 'last' 保留排在最后的相同值

    相关文章

      网友评论

          本文标题:pandas 2

          本文链接:https://www.haomeiwen.com/subject/aktxtqtx.html