美文网首页
2019-01-22 pandas /numpy练习使用/

2019-01-22 pandas /numpy练习使用/

作者: 至尊狼王 | 来源:发表于2019-01-24 13:30 被阅读0次

1.pandas结合numpy 处理整列数据方法

可以用于列分裂为多列的场景,其中df.A>3  等你想使用的各种判断

输入结果

2.   根据某一列的数据,进行样本筛选(行,为样本)

可用于跟据某个特征挑选样本

3.apply的使用

apply号称是自由度最高的使用函数,其实最关键的还是axis的赋值问题总容易搞混

axis根据下面的运行结果,好像是一列一列的‘喂进去’

以下是摘抄pandas官方例程中的例子

a.生成最原始的数据表

最原始的数据表

b.

          a.列操作?

把A列的所有值相加作为新A列,把B列的所有值相加作为新B列

       b.行操作?      

把第0行的数相加作为新0行,把第1行的数相加作为新1行,把第2行的数相加作为新2行

4.python中lambda的用法

a=lambda x,y,z:(x+8)*y-z

print(a(5,6,7))<=====>(5+8)*6-7=71

5.pandas中groupby()的使用


apply应用实例1 apply应用实例2






以A列作为分组求B、C列相应的均值

6. drop_去重操作

df.drop_duplicates(subset=['A','B'],keep='first',inplace=True)

7.  挑选列操作

挑选多行可以不按照顺序 挑选多行多列(可以不按照顺序) 行列的切片操作

dataframe删除操作

8.Pandas合并数据集

https://blog.csdn.net/u010414589/article/details/51135840

方式一: 使用merge方式

合并的列完全相同 合并的列不完全相同--使用inner选项 合并列不完全相同--以左表为主,右表没有的补齐,并删除与左表不同的项 合并列不完全相同--以右表为主,左表没有的补齐,并删除与右表不同的项  

方式二:使用concat

9.排序

通过索引排序 根据‘c’列的值进行排序 根据‘a’/'c'2列的顺序排序 唯一值

相关文章

网友评论

      本文标题:2019-01-22 pandas /numpy练习使用/

      本文链接:https://www.haomeiwen.com/subject/ypykjqtx.html