数据清洗案例:
1、导入各种包
2、将表格导入系统:这里使用了将一个表格的多个sheet同时导入
# 将一张表里的3个sheet都导入系统
table=[pd.read_excel("/Volumes/台电酷闪/数据分析/python学习/202010Python数据清理/meal_order_detail.xlsx",sheet_name=i) for i in range(0,3)]
3、复制一份数据,查询数据结构,以及数据的完整性,可以发现字段“logicprn_name"存在严重缺失,因此要删除
4、找到空值字段计数,删除空值严重的字段,再次查看数据
5、删除重复值
6、查询字段出现频率,确定是否重复
7、异常值探索
8、查找某个数据或者聚合操作
网友评论