美文网首页
pandas 的dataframe 数据处理的常用代码

pandas 的dataframe 数据处理的常用代码

作者: 无畏绽放 | 来源:发表于2020-03-06 21:22 被阅读0次

    删除含有特定数值的行:比如删除含0的行

    data_df[~data_df.isin([0])]
    

    浮点数的小数点位数设定

    data_df.round(2)
    

    NaN的处理

    删除该缺失值: data_df.dropna()
    均值替换填充该缺失值: data_df.fillna(data_df.mean(axis=0))
    下一个非缺失值填充该缺失值:data_df.fillna(method='bfill')
    前一个非缺失值填充该缺失值:data_df.fillna(method='ffill')
    

    更改某一列的数据类型

    data_df.列名= data_df.列名.astype('int') 
    

    删除重复index

    data_df[~data_df.index.duplicated(keep=’first’)]
    

    计算各行数据总和并作为新行添加到末尾

    df.loc['Row_sum'] = df.apply(lambda x: x.sum())
    

    计算各列数据总和并作为新列添加到末尾

    df['Col_sum'] = df.apply(lambda x: x.sum(), axis=1)
    

    相关文章

      网友评论

          本文标题:pandas 的dataframe 数据处理的常用代码

          本文链接:https://www.haomeiwen.com/subject/jdlorhtx.html