美文网首页
pandas模块

pandas模块

作者: glassyw | 来源:发表于2017-09-25 20:04 被阅读25次
清洗数据工的自我修养:)

0.增加索引

df.set_index('Team', inplace=False, drop=True) 
#以Team为索引
#inplace=True 在原数据集上修改
#默认情况下,设置成索引的列会从DataFrame中移除,drop=False将其保留下来

1.丢弃值

df.drop(['a','b'], axis=1)  # 按列(axis=1),丢弃指定的列,默认按行

2.拼接数据

pd.merge(new_A, new_B, how='left', on='Team')
#how:指的是合并(连接)的方式有inner(内连接),left(左外连接),right(右外连接),outer(全外连接);默认为inner
#on : 指的是用于连接的列索引名称。必须存在右右两个DataFrame对象中,如果没有指定且其他参数也未指定则以两个DataFrame的列名交集做为连接键

相关文章

网友评论

      本文标题:pandas模块

      本文链接:https://www.haomeiwen.com/subject/kbsdextx.html