美文网首页web服务器Pandas
Pandas(数据结构:Series)

Pandas(数据结构:Series)

作者: GHope | 来源:发表于2018-11-10 16:06 被阅读7次

    pandas是专门为处理表格和混杂数据设计的,而NumPy更适合处理统一的数值数组数据。


    导入Pandas的包并取别名为pd

    import pandas as pd
    

    Series

    Series是一种类似于一维数组的对象,它由一组数据(各种NumPy数据类型)以及一组与之相关的数据标签(即索引)组成。

     obj = pd.Series([4, 7, -5, 3])
    
    创建简单Series

    创建Series带有一个可以对各个数据点进行标记的索引

    obj2 = pd.Series([4, 7, -5, 3], index=['d', 'b', 'a', 'c'])
    
    带有索引的Series

    通过索引的方式选取Series中的单个或一组值

    obj2['a']
    
    obj2['d'] = 6
    
    obj2[['c', 'a', 'd']]
    
    obj2[obj2 > 0]
    
    obj2 * 2
    
    索引取值

    Series看成是一个定长的有序字典

     'b' in obj2 
    
     'e' in obj2 
    
    类似有序字典

    直接通过字典创建Series

    sdata = {'Ohio': 35000, 'Texas': 71000, 'Oregon': 16000, 'Utah': 5000}
    
     obj3 = pd.Series(sdata)
    
    利用字典创建Series

    传入排好序的字典的键以改变顺序

     states = ['California', 'Ohio', 'Oregon', 'Texas']
    
    obj4 = pd.Series(sdata, index=states)
    

    NaN(即“非数字”(not a number),在pandas中,它用于表示缺失或NA值。

    字典飞键改变顺序

    Pandas的isnull和notnull函数可用于检测缺失数据

    pd.isnull(obj4) 
    
    pd.notnull(obj4) 
    
    检测缺失数据

    Series最重要的一个功能是,它会根据运算的索引标签自动对齐数据

    自动对齐

    Series对象本身及其索引都有一个name属性

     obj4.name = 'population'
    
    obj4.index.name = 'state'
    
    name属性

    Series的索引可以通过赋值的方式就地修改

    obj.index = ['Bob', 'Steve', 'Jeff', 'Ryan']
    
    修改索引

    相关文章

      网友评论

        本文标题:Pandas(数据结构:Series)

        本文链接:https://www.haomeiwen.com/subject/iloyxqtx.html