美文网首页软件测试小强测试技术与人生杂谈测试员的那点事
基于python的大数据分析实战学习笔记-pandas(数据分析

基于python的大数据分析实战学习笔记-pandas(数据分析

作者: 测试帮日记 | 来源:发表于2019-06-03 22:19 被阅读3次

    点击链接加入QQ群229390571(免费公开课、视频应有尽有):https://jq.qq.com/?_wv=1027&k=5rbudQa

    pandas是啥?可能大家看过各种各样的解释,其实归结一句话ta就是一个数据分析包。。。

    pandas中常见的数据结构有三种,Series(一维数组,也叫序列),DataFrame(二维表格,类似excel多行多列),Panel(三维数组)

    那什么是数据结构呢?就是相互之间存在的一种或多种特定关系的数据类型的集合。

    好了,概念就是这么简单,相信有python基础的朋友应该很容易理解,如果你没有。。。。恩。。。就没有吧

    今天我们先来介绍下Series的用法,直接撸代码,里面有注释

    from pandas import Series

    #定义一个序列

    """

    一个序列可以存放不同的数据类型,索引index也是可以忽略的,可以通过下标访问(从0开始)

    运行可能会报错:

    ImportError: C extension: No module named 'pandas._libs.tslib' not built. If you want to import pandas from the source directory, you may need to run 'python setup.py build_ext --inplace --force' to build the C extensions first.

    解决方法:

    pip3 uninstall pandas

    pip3 install --user pandas

    """

    x=Series(['a',True,1],index=['first','second','thrid'])

    print('通过下标取值',x[1])

    print('通过索引取值',x['second'])

    #x[3] 不能越界访问会报错

    #x.append(666)#不能追加单个元素

    n=Series([666],index=['fourth'])#可以追加一个序列

    print('新增序列之后',x.append(n))

    if 1 in x.values:

        print('good')

    #切片

    print('切片:',x[1:3])

    #定位获取,常用于随机抽样

    print(x[[0,2,1]])

    #删除

    #x.drop(0)#根据下标

    #x.drop('first')#根据索引

    #按照下标找到索引名

    print(x.index[2])

    #根据值删除,返回新序列

    #x[2!=x.values

    #修改值

    x.index[True==x.values]

    #将字典转为series

    #Series(字典格式)

    #对index进行排序

    y=Series([2,3,1,5],index=['a','c','b','d'])

    print(y.sort_index(ascending=True))#ascending控制升还是降

    OS:写代码虽然累,但确实爽,你还不体验下?

    相关文章

      网友评论

        本文标题:基于python的大数据分析实战学习笔记-pandas(数据分析

        本文链接:https://www.haomeiwen.com/subject/otzhxctx.html