美文网首页pandas 必知必会
pandas新手入门教程一

pandas新手入门教程一

作者: 人工智能人话翻译官 | 来源:发表于2019-05-06 21:39 被阅读208次

    首先你需要准备一套开发环境,视频教程可以点这里

    导入模块

    import numpy as np
    import pandas as pd
    

    把这两个模块都先导入进来吧,以后就省事了!

    查看pandas的版本

    print(pd.__version__)
    

    输出

    0.24.1
    

    这样以后你看文档资料就知道该去看哪个版本了!~

    Series

    pd处理数据一般用两种数据结构Series和DataFrame,来看看Series。

    Series是1维的数据,把他理解成numpy中的一行就好了。

    import numpy as np
    import pandas as pd
    
    mylist = list('abc')
    myarr = np.arange(3)
    mydict = dict(zip(mylist, myarr))
    
    ser1 = pd.Series(mylist)
    ser2 = pd.Series(myarr)
    ser3 = pd.Series(mydict)
    
    print("{}\n{}\n{}\n".format(ser1, ser2, ser3))
    

    输出:

    0    a
    1    b
    2    c
    dtype: object
    0    0
    1    1
    2    2
    dtype: int64
    a    0
    b    1
    c    2
    dtype: int64
    

    Series可以方便的通过list,array还有dict来构建。

    输出的最后一行是Series中数据的类型,这里的数据都是int64类型的。
    数据在第二列输出,第一列是数据的索引,在pandas中称之为Index。


    series

    你也可以在构建Series的时候,指定index来代替默认的0~n数字式索引。

    ser4 = pd.Series([100,200,150], index = ['apple', 'banana', 'peach'])
    ser4
    

    输出:

    apple     100
    banana    200
    peach     150
    dtype: int64
    

    某种意义上Series有点像python中的字典。
    最后我们可以方便的通过下标和index来访问Series中的数据。
    下标方式访问:

    ser4['banana']#通过下标访问
    

    输出:

    200
    

    index方式访问:

    ser4[1] #通过index访问
    

    输出:

    200
    

    相关文章

      网友评论

        本文标题:pandas新手入门教程一

        本文链接:https://www.haomeiwen.com/subject/xddjoqtx.html