美文网首页呆鸟的Python数据分析
pandas实战操作1——series和DataFrame

pandas实战操作1——series和DataFrame

作者: 皮皮大 | 来源:发表于2019-08-28 14:47 被阅读0次
    import numpy as np
    import pandas as pd
    from pandas import Series, DataFrame
    
    Series和DataFrame.png

    Series创建

    • 基本知识
      • 类似于一维数组的对象
      • 由一组数据(各种Numpy数据类型)和数据标签(索引)组成
      • 左边索引,右边数值;
    • 不指定索引的话,自动从0开始;
    • 索引也可以自定义:index=['a', 'b', 'c', 'd']
    • 通过Python的字典类型创建
    image.png

    Series中值的获取

    • 通过索引的方式获取
      • 使用Series自己创建时候的索引
      • 使用默认的数值索引
      • 使用布尔型数组、标量乘法、应用函数等作为索引
    image.png

    索引操作

    索引缺失值处理

    • 缺失值用NaN表示
    • isnull和notnull检测缺失值
    image.png

    索引多样性

    image.png image.png

    Series对象的name属性

    • S数据本身和索引都有name属性
    • 能够直接指定name属性的值
    image.png

    索引就地修改

    image.png

    DataFrame

    • 表格型数据结构,含有一组有序的列
    • 既有行索引也有列索引

    DF创建

    • 使用pd.DataFrame(data)
    • 直接传入字典型数据
    • 通过columns参数指定各个属性的顺序
    image.png image.png

    DF操作1

    • 1、查看DF中有哪些列属性columns和索引index
    • 2、查看DF中的所有数据values,通过属性的方式
    • 3、查看DF中的部分数据
      • 查看列数据
        • 通过字典标记或者属性(.点)的方式
        • 获取到的其实就是个S型数据
        • frame[column] # 更通用
        • frame.column
      • 查看行数据
        • loc
        • iloc
    • 4、通过赋值修改某列的数据
      • 传入具体数值数据
      • 传入numpy生成的数据
      • 传入S型数据,长度需要和D型数据一致,否则空位上将被填上缺失值
      • 赋值新的列:如果操作的列不存在,则会自动创建
    image.png image.png image.png

    DF操作2(重点)

    • 1、 创建不存在的列:只能通过字典标记的形式
    • 2、创建布尔型数据
      • 如何创建一列布尔值(T/F)的数据
      • 如何创建一个新的属性数据
    • 3、删除数据del
    • 4、嵌套字典形式创建DF数据
      • 外层作为列索引
      • 内层作为行索引
    • 5、DF转置T
    • 6、DF中传入S型数据
    • 7、设置DF的columns和index属性的name属性
    image.png image.png image.png

    相关文章

      网友评论

        本文标题:pandas实战操作1——series和DataFrame

        本文链接:https://www.haomeiwen.com/subject/sahpectx.html