其实之前都写过小笔记了Python Pandas 中lambda和apply函数的应用。用到的方法还是针对dataframe的apply函数+lambda表达式,除此之外,还存在针对series的map函数和apply函数。
下面区分单列、多列和元素级别的的操作。
1. 对单列进行操作,Series.apply()函数和Series.map()函数
针对一个Series,map函数和apply函数均可操作,看官方文档的介绍,apply适用于更复杂的操作功能。
- Series.map()函数格式化字符串
s = pd.Series(['cat', 'dog', np.nan, 'rabbit'])
>>> s.map('I am a {}'.format, na_action='ignore')
0 I am a cat
1 I am a dog
2 NaN
3 I am a rabbit
dtype: object
- Series.apply()函数最大最小归一化
df['new_col'] = df['col'].apply(lambda x: x+2)
2. 对多列进行操作,DataFrame.apply()函数
apply函数是针对指定的轴进行操作的,所以其实是行列都可以操作的,对列进行操作时指定axis=1,如下所示
df['new_col'] = df.apply(lambda x: x['a'] + x['b'] - x['c'], axis=1)
def self_sum(a, b):
return a ^ 2 + b ^ 2
df['sum'] = df.apply(lambda x: self_sum(x['from'], x['to']), axis=1)
3. 对个体元素进行操作,DataFrame.applymap()函数
针对整个dataframe,比如获取每个元素的长度
df.applymap(lambda x: len(str(x)), na_action='ignore')
针对整个dataframe的操作可以直接操作的,比如df**2就是对每个元素进行平方,效率更高。
今天动手归一化pandas中dataframe的一个列,竟然还忘记加apply了,哎,基础功一点都不扎实呀
网友评论