用Excel的框架去学pandas(数据清洗)

作者: 成鹏9 | 来源:发表于2017-05-01 18:47 被阅读284次

    处理空值

    Excel方法

    在Excel中,碰到空值的时候直接可以通过定位空值之后然后进行统一改动。

    定位空值后处理空值

    Pandas方法

    dropna把带有空值的行全部去除。

    dropna

    fillna对空值进行填充。

    fillna

    清理字符串中的空格

    Excel方法

    Excel中可以通过替换的方法去除字符串中的空格。

    Pandas方法

    利用str.strip函数可以去除字符串中两边的空格(中间的空格不能去除)。

    清除空格

    大小写转换

    Excel方法

    Excel中我可以通过UPPER和LOWER函数对字符串进行大小写转换。

    Pandas

    pandas也有同名的函数可以用用来大小写转换。

    lower

    更改数据格式

    Excel方法

    Excel更改数据格式可以通过这个地方进行更改。

    更改数据格式

    Pandas方法

    用astype函数更改数据格式。

    更改数据格式

    提示:最好先把缺失值处理好才进行格式转换。

    更改列名称

    Excel方法

    直接在更改列标题即可。

    Pandas方法

    用rename函数进行更改,里面的内容用字典的方式展示。

    更改列名

    删除重复项

    Excel方法

    删除重复项

    Pandas方法

    删除重复项

    数值修改和替换

    Excel方法

    查找和替换

    Pandas方法

    替换

    相关文章

      网友评论

        本文标题:用Excel的框架去学pandas(数据清洗)

        本文链接:https://www.haomeiwen.com/subject/pwqqtxtx.html