dataframe 操作总结

作者: 锦绣拾年 | 来源:发表于2021-07-14 22:42 被阅读0次

dataframe 操作总结
API - 机器学习 - 速查
DataFrame做除法
入门Pandas，你必须掌握的技巧
Python—pandas
Pandas数据结构之DataFrame对象的操作
操作dataFrame
笔记：Python之Pandas的数据结构-Dataframe
pandas库学习(八) 函数应用和映射
SparkSQL、RDD和DataFrame基本操作

1、
去重

unique = df [df.duplicated(subset=[''])]#查重复行索引,默认除去了第一行
unique = df [df.duplicated()]
unique = df [df.duplicated(subset=[''],keep=False)]#得到所有的

keep{‘first’, ‘last’, False}, default ‘first’
Determines which duplicates (if any) to mark.

first : Mark duplicates as True except for the first occurrence.

last : Mark duplicates as True except for the last occurrence.

False : Mark all duplicates as True.

如何使用drop_duplicates进行简单去重（入门篇） - 侦探L的文章 - 知乎
https://zhuanlan.zhihu.com/p/116884554

合并

result = pd.merge(dfun, dftmp , how='left', on=['列名'])

筛选

df2 = df.loc[df['列名'==××]]
df2 = df[df['列名'==××]]
df2 = df[df['列名'].isin([list])]
df2 = df[~df['列名'].isin([list])]

随机抽取一些数

df = df.sample(frac=1).reset_index(drop=True)
.sample(frac=1)# 采样，frac表示采样比例

网友评论

本文标题：dataframe 操作总结

本文链接：https://www.haomeiwen.com/subject/cprelltx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

dataframe 操作总结

相关文章

dataframe 操作总结

API - 机器学习 - 速查

DataFrame做除法

入门Pandas，你必须掌握的技巧

Python—pandas

Pandas数据结构之DataFrame对象的操作

操作dataFrame

笔记：Python之Pandas的数据结构-Dataframe

pandas库学习(八) 函数应用和映射

SparkSQL、RDD和DataFrame基本操作

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读