美文网首页
2019-01-22 pandas /numpy练习使用/

2019-01-22 pandas /numpy练习使用/

作者: 至尊狼王 | 来源:发表于2019-01-24 13:30 被阅读0次

    1.pandas结合numpy 处理整列数据方法

    可以用于列分裂为多列的场景,其中df.A>3  等你想使用的各种判断

    输入结果

    2.   根据某一列的数据,进行样本筛选(行,为样本)

    可用于跟据某个特征挑选样本

    3.apply的使用

    apply号称是自由度最高的使用函数,其实最关键的还是axis的赋值问题总容易搞混

    axis根据下面的运行结果,好像是一列一列的‘喂进去’

    以下是摘抄pandas官方例程中的例子

    a.生成最原始的数据表

    最原始的数据表

    b.

              a.列操作?

    把A列的所有值相加作为新A列,把B列的所有值相加作为新B列

           b.行操作?      

    把第0行的数相加作为新0行,把第1行的数相加作为新1行,把第2行的数相加作为新2行

    4.python中lambda的用法

    a=lambda x,y,z:(x+8)*y-z

    print(a(5,6,7))<=====>(5+8)*6-7=71

    5.pandas中groupby()的使用


    apply应用实例1 apply应用实例2






    以A列作为分组求B、C列相应的均值

    6. drop_去重操作

    df.drop_duplicates(subset=['A','B'],keep='first',inplace=True)

    7.  挑选列操作

    挑选多行可以不按照顺序 挑选多行多列(可以不按照顺序) 行列的切片操作

    dataframe删除操作

    8.Pandas合并数据集

    https://blog.csdn.net/u010414589/article/details/51135840

    方式一: 使用merge方式

    合并的列完全相同 合并的列不完全相同--使用inner选项 合并列不完全相同--以左表为主,右表没有的补齐,并删除与左表不同的项 合并列不完全相同--以右表为主,左表没有的补齐,并删除与右表不同的项  

    方式二:使用concat

    9.排序

    通过索引排序 根据‘c’列的值进行排序 根据‘a’/'c'2列的顺序排序 唯一值

    相关文章

      网友评论

          本文标题:2019-01-22 pandas /numpy练习使用/

          本文链接:https://www.haomeiwen.com/subject/ypykjqtx.html