美文网首页我爱编程
科学计算基础库pandas

科学计算基础库pandas

作者: 训儿哥 | 来源:发表于2018-05-05 22:17 被阅读0次

pandas提供了类似关系型数据库的二维表容器,并基于容器上提供了很多高效的函数。通用导入写法为:import pandas as pd
官网10分钟上手教程介绍得很好,基本上重要的内容都有介绍,并且对每个主题都提供进一步深入的文档链接,可以将该网页作为学习pandas的主目录。pandas主要提供了一个二维表的数据结构DataFrame,该表的每一列是一个Series对象。

DataFrame对象

构造入口:
df = pd.DataFrame( 二维数组 ) #通常传入的是numpy二维数据
df = pd.read_csv('file.csv', [index_col='A'])    #读取csv文件
df =pd.to_csv('filename.csv',index=[True|False])    #存储到csv文件
查看数据
df.head( )
df.tail( )
df.describe( )
df.values  #numpy格式的数据,不包括index。常用于转换到numpy
选择数据
  1. 直接方式
    特定列:df['sun']df.sun效果相同
    特定行:df[0:10]
  2. 函数方式(推荐方法)
    通过标签选择 df.loc[行index,列名]
    通过位置选择 df.iloc[行下标,列下标]
处理缺失数据 NaN

提供了两种处理缺失值的方式
删除NaN所在行
df.dropna(how='any')
用某个值去替换
df.fillna(value=0)

Series对象

DataFrame的每一列是一个Series。
Series对象的函数较少直接使用,因为调 df.func() 时已经间接用到了。

相关文章

  • 科学计算基础库pandas

    pandas提供了类似关系型数据库的二维表容器,并基于容器上提供了很多高效的函数。通用导入写法为:import p...

  • 科学计算库pandas基础

    pandas Series:一种类似于一维数组的对象,是由一组数据(各种NumPy数据类型)以及一组与之相关的数据...

  • 推荐系统学习目录

    一、知识储备: 1、python基础2、科学计算库(numpy、pandas等掌握常用的函数) 二、算法基础(原理...

  • Numpy随笔

    Numpy NumPy是SciPy、Pandas等数据处理或科学计算库的基础 NumPy是一个开源的Python科...

  • Pandas 技巧(一)

    导语 在众多的科学计算库中,我认为Pandas对数据科学运算最有用。Pandas,加上Scikit-learn几乎...

  • Pandas备忘录

    众所周知,Pandas是最受欢迎的Python数据科学与分析库。 Numpy用于较低级别的科学计算。Pandas构...

  • 3. 通往机器学习用到的库

    Numpy: 科学计算库Pandas:数据分析处理库Matplotlib:数据可视化库scikit-learn:机...

  • Python:一篇文章掌握Numpy的基本用法

    前言 Numpy是一个开源的Python科学计算库,它是python科学计算库的基础库,许多其他著名的科学计算库如...

  • python技术栈

    基础库 Numpy:矩阵计算与其它大多数框架的数据处理基础; Scipy:科学计算库,提供了很多科学计算工具包和算...

  • python数据分析

    利用python进行数据分析需要使用的工具 pandas :数据分析处理库 numpy:科学计算库库 matplo...

网友评论

    本文标题:科学计算基础库pandas

    本文链接:https://www.haomeiwen.com/subject/zmktrftx.html