美文网首页Python相关的文章
详解pandas DataFrame修改行列名

详解pandas DataFrame修改行列名

作者: YuAllon | 来源:发表于2019-07-23 03:49 被阅读0次

写在前面的话:

在做WISE数据处理时,有时候需要将几组数据生成一个DataFrame,然而在生成的过程中我一般不会设置列的名字(因为这种过程可能会有很多步),所以最后的列名是默认的。为了方便自己以后读代码,还是希望最后已处理好的数据有相应的数据相关列名。

自己在网上也查了了一些人的解决办法,感觉没有一个能讲明白,现将自己的理解总结如下。

方法1:修改DataFrame的columns或index属性值

DataFrame属性链接:DataFrame。现在我们知道,对于每一个DataFrame都有index和columns两个属性,这两个属性给出了Dataframe的\color{red}{索引}\color{red}{列}的信息。所以我们可以对DataFrame的index或columns属性信息重新赋值,以达到对行或者列重新命名。

\color{red}{注}:这种方法是一次性将所有的行 or 列重新命名,不能仅对单个或几个行 or 列重新命名,因为DataFrame的index或columns属性值是不可更改的(即:可以将index属性值整体赋值,但不能对单个或者几个赋值)。

import numpy as np
import pandas as pd
df = pd.DataFrame({
    'col1':['a','a','b',np.nan,'c'],
    'col2':[2, 1, 8, 7, 6],
    'col3':[0, 4, 7, 2, 3],
})
df
    col1 col2 col3
0   a    2    0
1   a    1    4
2   b    8    7
3   NaN  7    2
4   c    6    3

#修改行标签
df.columns
Index(['col1', 'col2', 'col3'], dtype='object')

df.columns = ['a','b','c']
df
    a   b   c
0   a   2   0
1   a   1   4
2   b   8   7
3   NaN 7   2
4   c   6   3

#修改列标签
df.index = ['a0','a1','a2','a3','a4']
df
    col1 col2 col3
a0  a    2    0
a1  a    1    4
a2  b    8    7
a3  NaN  7    2
a4  c    6    3

方法2:pandas.DataFrame.rename()函数

rename函数是专门为了修改DataFrame坐标轴标签函数。rename函数的优点:可以\color{red}{选择性的修改}某行某列的标签。

\color{red}{注}:函数/字典中的值必须是唯一的(1对1)。 未包含在字典/Series中的标签将保留原样。 列出的额外标签不会引发错误。

DataFrame.rename(self, mapper=None, index=None, columns=None, axis=None, copy=True, inplace=False, level=None, errors='ignore')

参数介绍:

参数 含义
mapper 映射结构,修改columns或index要传入一个映射体,可以是字典、函数。修改列标签跟columns参数一起;修改行标签跟index参数一起。
index 行标签参数,mapper, axis=0 等价于 index=mapper
columns 列标签参数,mapper, axis=1 等价于 columns=mapper
axis 轴标签格式,0代表index,1代表columns,默认index
copy 默认为True,赋值轴标签后面的数据
inplace 默认为False,不在原处修改数据,返回一个新的DataFrame
level 默认为None,处理单个轴标签(有的数据会有2个或多个index或columns)
errors 默认ignore,如果映射体里面包含DataFrame没有的轴标签,忽略不报错

例子:

df = pd.DataFrame({"A": [1, 2, 3], "B": [4, 5, 6]})
df.rename(columns={"A": "a", "B": "c"})
   a  c
0  1  4
1  2  5
2  3  6

df.rename(index={0: "x", 1: "y", 2: "z"})
   A  B
x  1  4
y  2  5
z  3  6

df.rename(str.lower, axis='columns')
   a  b
0  1  4
1  2  5
2  3  6

df.rename({1: 2, 2: 4}, axis='index')
   A  B
0  1  4
2  2  5
4  3  6

参考:pandas.DataFrame.rename

作者:YuAllon
\color{red}{转载请告知}
2019-07-22

相关文章

网友评论

    本文标题:详解pandas DataFrame修改行列名

    本文链接:https://www.haomeiwen.com/subject/cmfnlctx.html