美文网首页我爱编程
善用pandas进行数据处理

善用pandas进行数据处理

作者: ochipe | 来源:发表于2018-01-18 10:30 被阅读0次
    最近有一个需求如下图 简单需求.png

    这些数据需要连表查询,一次性可以查出来 。但是其中涉及到一些计算,要么执行sql去查,比如最大值最小值等sql都有对应的函数处理也是比较快的,但是其中对应的每个条件之间是互斥的,这样用sql去查最少55次,很淡淡的忧伤,最后采用pandas来处理 。

    一 pandas是什么

    Pandas是python的一个数据分析包,是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建    的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法....
    

    二 怎么去实现以上的需求

    采用sqlalchemy+pandas
    具体实现如下:
    
    df = pd.read_sql(sql=sql_cmd, con=engine)
    上面的组装的sql一次性查出所有需要的数据,利用pandas装载,df是dateframe类型
    
    业内排名利用df.rank(axis=0,method='max')去实现
    下面四个单独出来的,因为每一列都是互斥的,遍历列,分别处理对应的df
    
    
    for info in cols:
        result = df.sort_values(by=info)[info].tolist()
        
    然后直接可以处理对应的数据,这样方便很多
    

    三 总结

    以上是对这个需求的处理办法,不知道各位大佬们有什么更好的办法,可以一起交流一下下

    相关文章

      网友评论

        本文标题:善用pandas进行数据处理

        本文链接:https://www.haomeiwen.com/subject/uypioxtx.html