美文网首页
pandas 高级用法

pandas 高级用法

作者: 黑夜的眸 | 来源:发表于2020-04-09 14:02 被阅读0次

    处理缺失值


    数据离散化

    1. 分组
      • 自动分组 new_sr = pd.qcut(sr, bins=3)
      • 自定义分组 new_sr = pd.cut(sr, bins=[0, 165, 185, 300])
    2. one-hot编码
      df = pd.get_dummies(new_sr , prefix=)

    合并

    • 方向合并
      pd.concat([df1, df2], axis=0)

      axis=0竖直合并
      axis=1 水平合并

    • 索引合并
      pd.merge()
      • 内连接


        pd.merge(left, right, how='inner', on=['key1', 'key2'])
      • 左连接


        pd.merge(left, right, how='left', on=['key1', 'key2'])
    • 右连接


      pd.merge(left, right, how='right', on=['key1', 'key2'])
    • 外连接


      pd.merge(left, right, how='outer', on=['key1', 'key2'])

    交叉表与透视表

    分组与聚合

    相关文章

      网友评论

          本文标题:pandas 高级用法

          本文链接:https://www.haomeiwen.com/subject/urlqmhtx.html