美文网首页
数据分析(二)

数据分析(二)

作者: ZplD | 来源:发表于2018-11-10 16:52 被阅读0次

Pandas

Series

Series是一种类似于一维数组的对象,由下面两个部分组成:

  • values:一组数据(ndarray类型)
  • index:相关的数据索引标签
  • Series的创建
    import pandas as pd
    from pandas import Series
    s = Series(data=None, index=None, dtype=None)
    # 参数如果传的是字典则以keys作为index,values作为data
    # data可为ndarray或者列表,如果不传index则系统会默认提供以0开始的index
    
  • Series索引
    #以index名索引
    s[index]
    #loc方法索引
    s.loc[index]
    #iloc方法索引
    s.iloc[index的下标]
    
  • Series的参数
    • s.index返还index
    • s.values返回Series的元素值
    • s.shape返回Series的维度
    • s.size返回Series的长度
  • Series查询缺失数据
    • s.isnull()返还一个Series有值的元素为False空值为True
    • s.notnull()则相反

DataFrame

DataFrame为一个多维的表格型数据结构

  • 参数

    • index行索引
    • columns列索引
    • values值
  • DataFrame的创建

from pandas import DataFrame
d = DataFrame(data=None, index=None, columns=None)
  • DataFrame的索引
    • 根据columns索引
    d[columns]
    
    • 根据index索引
    d.loc[index], d.loc[[index1,index2]]
    d.iloc[index的下标],d.iloc[[index下标1,index下标2]]
    

相关文章

网友评论

      本文标题:数据分析(二)

      本文链接:https://www.haomeiwen.com/subject/kavzxqtx.html