美文网首页
pandas 高级用法

pandas 高级用法

作者: 黑夜的眸 | 来源:发表于2020-04-09 14:02 被阅读0次

处理缺失值


数据离散化

  1. 分组
    • 自动分组 new_sr = pd.qcut(sr, bins=3)
    • 自定义分组 new_sr = pd.cut(sr, bins=[0, 165, 185, 300])
  2. one-hot编码
    df = pd.get_dummies(new_sr , prefix=)

合并

  • 方向合并
    pd.concat([df1, df2], axis=0)

    axis=0竖直合并
    axis=1 水平合并

  • 索引合并
    pd.merge()
    • 内连接


      pd.merge(left, right, how='inner', on=['key1', 'key2'])
    • 左连接


      pd.merge(left, right, how='left', on=['key1', 'key2'])
  • 右连接


    pd.merge(left, right, how='right', on=['key1', 'key2'])
  • 外连接


    pd.merge(left, right, how='outer', on=['key1', 'key2'])

交叉表与透视表

分组与聚合

相关文章

网友评论

      本文标题:pandas 高级用法

      本文链接:https://www.haomeiwen.com/subject/urlqmhtx.html