美文网首页Pandas转录组或基因组知识
Pandas三大利器-map、apply、applymap

Pandas三大利器-map、apply、applymap

作者: 皮皮大 | 来源:发表于2020-06-21 22:46 被阅读0次

    Pandas三大利器-map、apply、applymap

    我们在利用pandas进行数据处理的时候,经常会对数据框中的单行、多行(列也适用)甚至是整个数据进行某种相同方式的处理。

    比如将数据中的sex字段中男替换成1,女替换成0。自己最近处理数据的时候就遇到不少类似的需求。在这种情况下用for循环是一种很简单、直接的方式,但是运行效率很低。

    本文中介绍了pandas中的三大利器:map、apply、applymap来解决上述的需求。

    image

    模拟数据

    通过一个模拟的数据来说明3个函数的使用,在这个例子中学会了如何生成各种模拟数据。数据如下:

    import pandas as pd
    import numpy as np
    
    boolean = [True, False]
    gender = ["男","女"]
    color = ["white","black","red"]
    
    # 好好学习如何生成模拟数据:非常棒的例子
    # 学会使用random模块中的randint方法
    
    df = pd.DataFrame({"height":np.random.randint(160,190,100),
                         "weight":np.random.randint(60,90,100),
                         "smoker":[boolean[x] for x in np.random.randint(0,2,100)],
                         "gender":[gender[x] for x in np.random.randint(0,2,100)],
                         "age":np.random.randint(20,60,100),
                         "color":[color[x] for x in np.random.randint(0,len(color),100)]
                        })
    df.head()
    
    
    image

    map

    demo

    map() 会根据提供的函数对指定序列做映射。

    第一个参数 function 以参数序列中的每一个元素调用 function 函数,返回包含每次 function 函数返回值的新列表

    map(function, iterable)
    

    实际数据

    image

    实际数据

    将gender中男变成1,女变成0

    # 方式1:通过字典映射实现
    dic = {"男":1, "女":0}  # 通过字典映射
    df1 = df.copy()   # 副本,不破坏原来的数据df
    df1["gender"] = df1["gender"].map(dic)
    df1
    
    # 方式2:通过函数实现
    def map_gender(x):
        gender = 1 if x == "男" else 0
        return gender
    
    df2 = df.copy()
    # 将df["gender"]这个S型数据中的每个数值传进去
    df2["gender"] = df2["gender"].map(map_gender)
    df2
    
    image

    apply

    apply方法的作用原理和map方法类似,区别在于apply能够传入功能更为复杂的函数,可以说apply是map的高级版

    pandas 的 apply() 函数可以作用于 Series 或者整个 DataFrame,功能也是自动遍历整个 Series 或者 DataFrame, 对每一个元素运行指定的函数。

    DataFrame对象的大多数方法中,都会有axis这个参数,它控制了你指定的操作是沿着0轴还是1轴进行。axis=0代表操作对列columns进行,axis=1代表操作对行row进行

    demo

    1. 上面的数据中将age字段的值都减去3,即加上-3
    def apply_age(x,bias):
        return x + bias
        
    df4 = df.copy()
    # df4["age"]当做第一个值传给apply_age函数,args是第二个参数
    df4["age"] = df4["age"].apply(apply_age,args=(-3,))
    
    image
    1. 计算BMI指数
    # 实现计算BMI指数:体重/身高的平方(kg/m^2)
    def BMI(x):
        weight = x["weight"]
        height = x["height"] / 100
        BMI = weight / (height **2)
        
        return BMI
    
    df5 = df.copy()
    df5["BMI"] = df5.apply(BMI,axis=1)  # df5现在就相当于BMI函数中的参数x;axis=1表示在列上操作
    df5 
    
    image image

    DF型数据的apply操作总结:

    1. axis=0时,对每列columns执行指定函数;当axis=1时,对每行row执行指定函数。

    2. 无论axis=0还是axis=1,其传入指定函数的默认形式均为Series,可以通过设置raw=True传入numpy数组

    3. 对每个Series执行结果后,会将结果整合在一起返回(若想有返回值,定义函数时需要return相应的值)

    apply实现需求

    通过apply方法实现上面的性别转换需求。apply方法中传进来的第一个参数一定是函数

    image

    applymap

    DF数据加1

    applymap函数用于对DF型数据中的每个元素执行相同的函数操作,比如下面的加1:

    image

    保留2位有效数字

    image

    相关文章

      网友评论

        本文标题:Pandas三大利器-map、apply、applymap

        本文链接:https://www.haomeiwen.com/subject/tcyzxktx.html