python数据分析工具pandas作业:合并excel重复行
工作中经常有些数据,从多个EXCEL表中汇总后,会出现同一项目多条记录的情况,需要合并这些对应的记录。
数据示例:
下图中,我们state和year能确定一个项目,但是有2条记录,我们需要把对应记录的pop值相加。
图片.png代码
#!/usr/bin/python3
# -*- coding: utf-8 -*-
# 技术支持:https://www.jianshu.com/u/69f40328d4f0
# 技术支持 https://china-testing.github.io/merge_excel_rows.html
# https://github.com/china-testing/python-api-tesing/blob/master/practices/pandas/merge_excel_rows.py
# 项目实战讨论QQ群630011153 144081101
# CreateDate: 2018-12-06
import pandas as pd
frame = pd.read_csv("test.csv")
df = frame.groupby(['state', 'year']).sum()
df.to_csv("out.csv")
输出的out.csv如下:
图片.png
网友评论