美文网首页js css html
Python pandas 对单列多列进行操作

Python pandas 对单列多列进行操作

作者: 王叽叽的小心情 | 来源:发表于2022-10-25 20:50 被阅读0次

    其实之前都写过小笔记了Python Pandas 中lambda和apply函数的应用。用到的方法还是针对dataframe的apply函数+lambda表达式,除此之外,还存在针对series的map函数和apply函数。

    下面区分单列、多列和元素级别的的操作。

    1. 对单列进行操作,Series.apply()函数和Series.map()函数

    针对一个Series,map函数和apply函数均可操作,看官方文档的介绍,apply适用于更复杂的操作功能。

    • Series.map()函数格式化字符串
    s = pd.Series(['cat', 'dog', np.nan, 'rabbit'])
    
    >>> s.map('I am a {}'.format, na_action='ignore')
    0     I am a cat
    1     I am a dog
    2            NaN
    3  I am a rabbit
    dtype: object
    
    • Series.apply()函数最大最小归一化
    df['new_col'] = df['col'].apply(lambda x: x+2)
    
    2. 对多列进行操作,DataFrame.apply()函数

    apply函数是针对指定的轴进行操作的,所以其实是行列都可以操作的,对列进行操作时指定axis=1,如下所示

    df['new_col'] =  df.apply(lambda x: x['a'] + x['b'] - x['c'], axis=1)
    
    def self_sum(a, b):
       return a ^ 2 + b ^ 2
    
    df['sum'] = df.apply(lambda x: self_sum(x['from'], x['to']), axis=1)
    
    3. 对个体元素进行操作,DataFrame.applymap()函数

    针对整个dataframe,比如获取每个元素的长度

    df.applymap(lambda x: len(str(x)), na_action='ignore')
    

    针对整个dataframe的操作可以直接操作的,比如df**2就是对每个元素进行平方,效率更高。

    今天动手归一化pandas中dataframe的一个列,竟然还忘记加apply了,哎,基础功一点都不扎实呀

    相关文章

      网友评论

        本文标题:Python pandas 对单列多列进行操作

        本文链接:https://www.haomeiwen.com/subject/outzzrtx.html