美文网首页解密大数据
商业数据分析第一次课学习笔记

商业数据分析第一次课学习笔记

作者: 孤单不孤单 | 来源:发表于2017-07-10 16:25 被阅读89次

    1.Python包的导入

    * 貌似 jupyter 有种方法可以不用导入 matplotlib.pyplot 就可以实现图形的展示,待研究

    导入

    补充说明:

    1.可以使用%matplotlib inline

    以%开头为magic keywords 使用%matplotlib inline方法绘图

    2.stock.plt() 为 pandas 内置作图函数


    2.读取本地数据库,解析index,并指定“Date”为本数据库的索引

    读取数据库

    3.查看数据,一共有4种方法:

    stock -- 查看全量数据(当数据量过大时,中间会用“...”隐藏)

    stock.head() -- 默认查看前5行数据,增加参数后可自定义查看行数

    stock.tail() -- 默认查看逆序5行数据,增加参数后可自定义查看行数

    stock.info() -- 以参数值方式查看数据库

    stock方法 以参数值方式查看数据库

    4.计算基础统计值

    通过 stock.describe()可以输出 计数、均值、标准差、最大/最小值、1/4、1/2、3/4位值

    计算基础统计值

    5.通过 matplotlib 绘图(pandas默认将索引作为 X 轴)

    默认出全量数据 stock.plot() ,可通过定义Y轴 stock.plot(y = 'Open') 指定出图字段

    matplotlib 绘图

    6.索引和切片,三种方式:

    (1)使用[]

    stock["Close"] -- 读取全量 Close 列表

    stock["Close"]['2017-06-01'] -- 读取指定索引 Close 列表

    使用[]

    (2)使用 .loc[]

    stock.loc['2017-06-01','Close'] -- 读取指定索引 Close 列表

    stock.loc['2017-06-01':'2017-06-05','Close'] -- 读取指定索引区间 Close 列表

    使用 .loc[]

    (3)使用 .iloc[]

    stock.iloc[0,3] -- 读取第0行3列值

    stock.iloc[0:2,0:3] -- -- 读取第0-2行0-3列值

    使用 .iloc[]

    (4)另一种通过命令方式读取全量数据方法

    通过命令方式读取数据

    7.过滤

    判断“Volume”是否大于5千万 “Volume”大于5千万的数据 “Close”大于“Open”的数据

    8.生成新列

    将“High”与“Low”差值写入“fluctuation”新列中

    相关文章

      网友评论

        本文标题:商业数据分析第一次课学习笔记

        本文链接:https://www.haomeiwen.com/subject/srxuhxtx.html