美文网首页
pandas学习笔记(2)

pandas学习笔记(2)

作者: MWhite | 来源:发表于2018-05-29 20:12 被阅读0次

排序

reviews.groupby('points').points.count()
reviews.groupby('points').price.min()
reviews.groupby('winery').apply(lambda df: df.title.iloc[0]) # 返回每个winery分组里面第一个元素的title值
reviews.groupby(['country', 'province']).apply(lambda df: df.loc[df.points.argmax()]) # 根据两个元素进行分组,然后选出每组中points最大的元素。argmax 是series中最大值的index
reviews.groupby(['country']).price.agg([len, min, max]) #agg 返回一个dataframe
the order of the rows is dependent on the values in the index, not in the data.

多指针

groupby参数为多组时会出现
countries_reviewed.reset_index() # 重新赋予一个指针

sort

countries_reviewed.sort_values(by='某个数值特征名'', ascending=False) # ascend上升
countries_reviewed.sort_values(by=['country', 'len'])

数据类型

reviews.price.dtype
reviews.dtypes
reviews.points.astype('float64')

缺失数据

reviews[reviews.country.isnull()]  # pd.notnull
reviews.region_2.fillna("Unknown")
reviews.taster_twitter_handle.replace("@kerinokeefe", "@kerino") # 替换

合并

pd.concat([df1, df4], axis=1, sort=False) # axis 0为纵向合并

其他

inplace 是对原dataframe进行修改还是结果储存为新dataframe

titanic_df['Fare'] = titanic_df['Fare'].astype(int)

等切分
train['CategoricalFare'] = pd.qcut(train['Fare'], 4) #qcut 根据数量 或者cut 根据取值

交叉表格 横行是一种属性 纵列是另一种属性
pd.crosstab(train['Title'], train['Sex'])

统一修改值
dataset['Sex'] = dataset['Sex'].map( {'female': 0, 'male': 1} ).astype(int)

idmax()

rename
表格合并

相关文章

  • pandas学习笔记

    pandas学习笔记 1.安装 2.学习代码-Series code 1 0 1001 py...

  • pandas学习笔记(2)

    排序 reviews.groupby('points').points.count()reviews.groupb...

  • pandas学习笔记(2)

    练习:泰坦尼克号逃生率 kaggle上一道经典题目,拿来做一点小练习。有一个csv文件(点击下载)密码:yqto。...

  • pandas学习笔记-2

    3.为什么pandas命令以括号结尾,其他的命令不呢?(源码见demo3.py) 4. 在pandas DataF...

  • 大师兄的Python机器学习笔记:Pandas库

    大师兄的Python机器学习笔记:实现评估模型 一、关于Pandas 1. Pandas和Numpy Pandas...

  • pandas索引取数

    注:《利用python进行数据分析》的学习笔记-pandas import pandas as pd import...

  • pandas-基础笔记

    Pandas学习笔记-基础篇 参考资料 https://www.yiibai.com/pandas/ 导入模块 S...

  • 学习笔记----机器学习(三)

    我是iOS开发者之一。我们的App:今日好出行 申明一下,只是学习笔记,只是学习笔记,只是学习笔记。 Pandas...

  • pandas学习笔记

    Pandas库的介绍 Pandas是一个开放源码的Python库,它使用强大的数据结构提供高性能的数据操作和分析工...

  • pandas学习笔记

    pandas 读取 csv 文件 查看pandas的列名以及列数 pandas 查看某一列的全部数据或部分数据 查...

网友评论

      本文标题:pandas学习笔记(2)

      本文链接:https://www.haomeiwen.com/subject/sxmajftx.html