pandas

作者: 七七总是很暴躁 | 来源:发表于2022-10-30 10:37 被阅读0次
    1. dataframe取差集:A-B
      先把B表append到A,再用去重函数删除(选择不保留模式),得到的结果就是两表的差集A-B:
      dfC=dfA.append(dfB).drop_duplicates(keep=False)
    2. df拼接:
      pd.cnocat([df1,df2],axis=0),0-从下方纵向增加记录;1-从右侧增加字段
    3. datacompy的abs_tol和rel_tol
      datacompy.Compare(..., ans_tol=0.5)表示abs(a-b)小于0.5;
      datacompy.Compare(..., rel_tol=1e-10)表示abs(a / b - 1)小于10^-10
    4. groupby
      df2 = df1.groupby(key, as_index=False).agg({'test1':'sum'})
      sum为计算方式,可以为sum可以为mean;
      数据列内如果存在不同类型数据无法sum,该列会被丢弃,因此groupby之前最好fillna

    相关文章

      网友评论

        本文标题:pandas

        本文链接:https://www.haomeiwen.com/subject/ruvifrtx.html