1.pandas结合numpy 处理整列数据方法
可以用于列分裂为多列的场景,其中df.A>3 等你想使用的各种判断输入结果
2. 根据某一列的数据,进行样本筛选(行,为样本)
可用于跟据某个特征挑选样本3.apply的使用
apply号称是自由度最高的使用函数,其实最关键的还是axis的赋值问题总容易搞混
axis根据下面的运行结果,好像是一列一列的‘喂进去’以下是摘抄pandas官方例程中的例子
a.生成最原始的数据表
最原始的数据表b.
a.列操作?
把A列的所有值相加作为新A列,把B列的所有值相加作为新B列b.行操作?
把第0行的数相加作为新0行,把第1行的数相加作为新1行,把第2行的数相加作为新2行4.python中lambda的用法
a=lambda x,y,z:(x+8)*y-z
print(a(5,6,7))<=====>(5+8)*6-7=71
5.pandas中groupby()的使用
6. drop_去重操作
df.drop_duplicates(subset=['A','B'],keep='first',inplace=True)
7. 挑选列操作
挑选多行可以不按照顺序 挑选多行多列(可以不按照顺序) 行列的切片操作dataframe删除操作
8.Pandas合并数据集
https://blog.csdn.net/u010414589/article/details/51135840
方式一: 使用merge方式
合并的列完全相同 合并的列不完全相同--使用inner选项 合并列不完全相同--以左表为主,右表没有的补齐,并删除与左表不同的项 合并列不完全相同--以右表为主,左表没有的补齐,并删除与右表不同的项方式二:使用concat
网友评论