Python3 和金融之 NumPy 篇

作者: 运维开发_西瓜甜 | 来源:发表于2018-12-02 08:01 被阅读6次

Python3 和金融之 NumPy 篇
Mac--Python3.5安装Numpy库
统计数第三周——实践
ubuntu +python3
python3 pandas模块
安装基于Python3 的NumPy, SciPy和Scikit
NumPy之索引技巧
64位Win7搭建Python开发平台Python3 + Ipy
python3 numpy模块
Python学习给照片换底色(蓝底换红底)

Python3 和金融简单介绍

如何使用Python进行量化投资？

自己编写：NumPy+pandas+Matplotlib+……
在线平台：聚宽、优矿、米筐、Quantopian、……
开源框架：RQAlpha、QUANTAXIS、……

涉及到量化投资第三方相关模块

NumPy：用于数值计算
pandas：用于数据分析
Matplotlib：用于图表绘制

Numpy 的使用

1. Numpy 简单介绍

主要用于数值计算
NumPy是高性能科学计算和数据分析的基础包。
它是pandas等其他各种工具的基础。

2. NumPy 的主要功能：

ndarray，一个多维数组结构，高效且节省空间
无需循环对整组数据进行快速运算的数学函数
*读写磁盘数据的工具以及用于操作内存映射文件的工具
*线性代数、随机数生成和傅里叶变换功能
*用于集成C、C++等代码的工具

3. 安装方法：

pip install numpy

4. 官方推荐的引用方式：

import numpy as np

5. NumPy 的 ndarray

NumPy 最主要的特点是其 N 维数组对象，即 ndarray。该对象以一个快速而灵活的大数据集容器。
可以利用这组数组对象对整块数据进行一些数学计算，如：+ 、 - 、 * 、 / 、%% 等。

ndarray 是一个通用的同构数据多维容器。也就是说其中所有的元素都必须是同一类型的，字符串和数字不能同时存在，浮点数和整数也不能同时存在。

Numpy 把数组的维数称为它的秩(rank)。

一维数组就像是一行数据
二维数组就像是一张包含行和列的表格
三维数组就像是一个魔方
每一维的长度不要求相同

每个数组对象都有几个常用的对象：

ndim （返回数组的秩）
shape （返回数组每一秩(维)的元素的数量，也表示了此数组组的形状）
size （返回数组中所有元素的个数）
dtype （返回数组的数据类型）

6. ndarray 数组的特性

数组中的元素必须是同一类型;

已知的类型有：字符串(<U1)、正整数int(8/16/32/64)、无符号整数uint(8/16/32/64)、float(16/32/64)
数组被创建后，是固定的长度。

就是说数组一旦被创建成功，它的内存是固定的，不可向其添加和删除元素，但可以改变其中元素的值。

7. 创建 ndarray 对象

使用 array（）就可以创建任意维度的数组对象

没有维度

# 创建一个指定类型为 字符串 的数组
In [33]: a1 = np.array([1,2,3],'U1')

# 获取数组对象的元素类型
In [34]: a1.dtype
Out[34]: dtype('<U1')

# 获取数组对象的维度，一维时不显示维度只显示 列
In [35]: a1.shape
Out[35]: (3,)

# 获取数组对象中的第一个元素的值
In [36]: a1[0]
Out[36]: '1'

# 创建默认整数类型的数组对象
In [37]: a2 = np.array([1,2,3])

# 默认整数类型的位数，是按照本机的操作系统而定的，32位/64位
In [38]: a2.dtype
Out[38]: dtype('int64')

2 维
可以理解为 2 行，每行有 n 列数据

In [6]: a23 = np.array([[1,2,3],[4,5,6]])

In [7]: a23
Out[7]:
array([[1, 2, 3],
       [4, 5, 6]])

In [8]: a23.shape
Out[8]: (2, 3)      # 表示一个 2 维 3 列的数组

3 维
可以理解为 3 页 n 行 n 列

In [12]: a323 = np.array([
    ...:  [[1,2,3],[4,5,6]],
    ...:  [[7,8.,9],[10,11,12]],
    ...: [[13,14,15],[16,17,18]]
    ...: ])

In [13]: a323
Out[13]:
array([[[  1.,   2.,   3.],
        [  4.,   5.,   6.]],

       [[  7.,   8.,   9.],
        [ 10.,  11.,  12.]],

       [[ 13.,  14.,  15.],
        [ 16.,  17.,  18.]]])

In [14]: a323.shape
Out[14]: (3, 2, 3)     # 表示一个 3 页 2 行 3 列的数组

shape 最后的数字总是表示有几列数据

8. 创建一些特殊的数组对象

全零

In [19]: zero = np.zeros(10)

In [20]: zero
Out[20]: array([ 0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.])

In [21]: zero.dtype
Out[21]: dtype('float64')   # 默认类型是 float

In [65]: z35 = np.zeros((3,5))    # 创建多维的空数组

In [66]: z35
Out[66]:
array([[ 0.,  0.,  0.,  0.,  0.],
       [ 0.,  0.,  0.,  0.,  0.],
       [ 0.,  0.,  0.,  0.,  0.]])

In [67]: z35.shape
Out[67]: (3, 5)

全一

In [24]: onety = np.ones(5)

In [25]: onety
Out[25]: array([ 1.,  1.,  1.,  1.,  1.])

In [26]: onety.dtype
Out[26]: dtype('float64')

In [27]: onetyint = np.ones(5,'int32')  # 可以显示的指定类型

In [28]: onetyint.dtype
Out[28]: dtype('int32')

空
这个空值的数组，其元素的值会是一个随机的值，这时其值也会有两种情况
1. 假如创建的空数组的列数，刚好在此内存环境中被创建过，那么空数组的元素的值就是之前创建过的值。
2. 假如穿件的空数组的列数，在此内存环境中不存在，则空数组中的元素的值会是一个随机数

`因为在每次创建这种数组时，会申请一块儿新内存，成功申请后，此时内存的数据并不会被清除掉。`

In [30]: empty = np.empty(5)

In [31]: empty
Out[31]: array([ 1.,  1.,  1.,  1.,  1.])   # 之前创建过列相同的数组

In [32]: empty.shape
Out[32]: (5,)

In [33]: empty.dtype
Out[33]: dtype('float64')

In [35]: empty2 = np.empty(8)

In [36]: empty2
Out[36]:
array([ -3.10503618e+231,  -4.33951848e-311,   9.76118064e-313,
         2.46151512e-312,   2.37663529e-312,   2.12199584e-314,
         2.24759075e-314,   5.56270712e-309])

In [37]: empty2.shape
Out[37]: (8,)

In [38]: empty2.dtype
Out[38]: dtype('float64')

random
random 会创建 0.0 到 1.0 之间的随机数组成矩阵，接受 1 个参数，这个参数可以是一个任意数字(表示要创建元素的个数）或一个表示数组形状的元组。

>>> np.random.random(3)
array([0.05499027, 0.95205191, 0.13715412])

创建单位矩阵

In [48]: eye1 = np.eye(1)

In [49]: eye1
Out[49]: array([[ 1.]])
In [53]: eye2
Out[53]:
array([[ 1.,  0.],
       [ 0.,  1.]])

In [57]: eye5
Out[57]:
array([[ 1.,  0.,  0.,  0.,  0.],
       [ 0.,  1.,  0.,  0.,  0.],
       [ 0.,  0.,  1.,  0.,  0.],
       [ 0.,  0.,  0.,  1.,  0.],
       [ 0.,  0.,  0.,  0.,  1.]])
In [58]: eye1.shape
Out[58]: (1, 1)

In [59]: eye2.shape
Out[59]: (5, 5)

In [60]: eye5.shape
Out[60]: (5, 5)

arange

数组版的 range，支持步长为浮点数

In [77]: np.arange(1,10)
Out[77]: array([1, 2, 3, 4, 5, 6, 7, 8, 9])

In [78]: np.arange(1,5,0.3)
Out[78]:
array([ 1. ,  1.3,  1.6,  1.9,  2.2,  2.5,  2.8,  3.1,  3.4,  3.7,  4. ,
        4.3,  4.6,  4.9])

linspace
利用指定数组内元素的个数，来创建数组。
这个时候，步长是不固定的

In [83]: lin1 = np.linspace(3,4)

In [84]: lin1.shape
Out[84]: (50,)

In [85]: lin1 = np.linspace(3,6)

In [86]: lin1.shape
Out[86]: (50,)

In [87]: lin6 = np.linspace(3,6,6)

In [88]: lin6.shape
Out[88]: (6,)

In [89]: lin6
Out[89]: array([ 3. ,  3.6,  4.2,  4.8,  5.4,  6. ])

前两个参数和 arange 一样，最后一个参数是要创建元素的个数。默认不填，是 50 个。创建后的元素之间的步长是相等的。

并且有一点和arange不同，定义元素的结束位置的值会被包含在创建的元素中

reshape

可以改变数组的形状

In [43]: arr = np.arange(10)

In [44]: arr
Out[44]: array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [45]: arr.ndim
Out[45]: 1

In [46]: arr.shape
Out[46]: (10,)

In [47]: arr = arr.reshape(5,2)

In [48]: arr
Out[48]:
array([[0, 1],
       [2, 3],
       [4, 5],
       [6, 7],
       [8, 9]])

In [49]: arr.ndim
Out[49]: 2

In [50]: arr.shape
Out[50]: (5, 2)

In [51]: arr.size
Out[51]: 10

In [52]: arr.shape = (2,5)   # 也可以对数组的 shape 属性进行赋值一个表示形状的元组，来达到同样的效果

In [53]: arr
Out[53]:
array([[0, 1, 2, 3, 4],
       [5, 6, 7, 8, 9]])

In [54]: arr.ndim
Out[54]: 2

In [55]: arr.shape
Out[55]: (2, 5)

对表示形状的元组唯一的限制是，秩的乘积必须要等于数组所有元素的个数（上例中是 10 ）。
也可以和 arange 配合， arange 接受一个参数，这个参数表示要创建数组的元素的方位值，就是 arange 的最后一个参数
后面跟 reshape， reshape 接受两个参数，表示要创建数组的形状，比如创建一个 3 行 5 列的 3 维数组，示例如下：

In [98]: np.arange(15).reshape(3,5)
Out[98]:
array([[ 0,  1,  2,  3,  4],
       [ 5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14]])

In [99]: np.arange(15).reshape(3,4)
---------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
<ipython-input-99-166c0c33e02b> in <module>()
----> 1 np.arange(15).reshape(3,4)

ValueError: cannot reshape array of size 15 into shape (3,4)

In [100]: np.arange(15).reshape(1,15
     ...: )
Out[100]: array([[ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14]])

In [101]: np.arange(1,5),reshape(2,2)

需要注意的是， arange 的参数，必须是 reshape 两个参数的乘积。

数组之间以及数组和数字之间的运算

不论怎么运算，最初的数组的值不会别改变；可以把运算的结果重新赋值给原来数组的变量，或者赋值给一个新的变量。

数组和数字之间的运算

In [111]: ar1 = np.array([1,2,3])

In [112]: ar1 + 1
Out[112]: array([2, 3, 4])

In [113]: ar1 - 1
Out[113]: array([0, 1, 2])

In [114]: ar1 * 2
Out[114]: array([2, 4, 6])

In [115]: ar1 / 2
Out[115]: array([ 0.5,  1. ,  1.5])

In [116]: ar1 // 3
Out[116]: array([0, 0, 1])

In [117]: ar1 ** 2
Out[117]: array([1, 4, 9])

In [118]: ar1
Out[118]: array([1, 2, 3])

数组之间的运算

In [118]: ar1
Out[118]: array([1, 2, 3])

In [119]: ar2 = np.array([4,5,6])

In [120]: ar1 + ar1
Out[120]: array([2, 4, 6])

In [121]: ar1 * 2
Out[121]: array([2, 4, 6])

In [122]: ar1 + ar2
Out[122]: array([5, 7, 9])

In [123]: ar3 = np.array([3,5])  

In [124]: ar1 + ar3  # 两个数组之间运算，两个数组的元素个数和形状必须一样
---------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
<ipython-input-124-f49987d67b64> in <module>()
----> 1 ar1 + ar3

ValueError: operands could not be broadcast together with shapes (3,) (2,)

不论几维的数组之间运算，都是对数组里每个元素进行逐个运算。

9. 数组的索引和切片

9.1. 没有维度的数组

没有维度的数组的索引和切片的方法几乎和 Python 中列表一样，区别是切片复制不会自动复制。

索引

In [3]: ar1 = np.arange(1,5)

In [4]: ar1
Out[4]: array([1, 2, 3, 4])

In [5]: ar1[0]
Out[5]: 1

In [7]: ar1[2]
Out[7]: 3

In [8]: ar2 = ar1[1]    # 利用索引，找到索引位置的值，之后赋值给一个新的变量，
                        # 此时 ar2 是一个变量，不是一个 ndarray 的数组对象。

In [9]: ar2
Out[9]: 2

切片

In [16]: ar1
Out[16]: array([1, 2, 3, 4])

In [17]: ar1[:]
Out[17]: array([1, 2, 3, 4])

In [18]: ar1[1:2]
Out[18]: array([2])

In [19]: ar2 = ar1[1:2]

In [20]: ar2
Out[20]: array([2])

In [21]: ar3 = ar1[1:3]

In [22]: ar3
Out[22]: array([2, 3])

In [23]: ar3[1]=20

In [24]: ar3
Out[24]: array([ 2, 20])

In [25]: ar1
Out[25]: array([ 1,  2, 20,  4])

可以看出，数组的切片不会自动复制，改变切片后的数组的元素值，原数组的元素值也会跟着改变；不同于Python中的列表

15048375609486.jpg

对于上图说明一下：
先说明一点，muqi在大部分语言环境中
ar_name1 是一个元数组，当利用切片取值元素 2 去创建一个新的数组 ar_name2 的时候，系统会建立一个指针，指针指向了原数组元素 2 的原来的内存地址，并不会重新申请新的内存地址。所以当在 ar_name2 上，更改其元素的值，原数组 ar_name1 上对应的元素的值也会被改变。
但是，当原数组 ar_name1 被重新赋值后，新的 ar_name2 还会保持不变的。

切片赋值时，强制复制

In [34]: ar1
Out[34]: array([ 1,  2, 20,  4])

In [35]: ar4 = ar1[1:].copy()

In [36]: ar4
Out[36]: array([ 2, 20,  4])

In [37]: ar4[1] = 3

In [38]: ar4
Out[38]: array([2, 3, 4])

In [39]: ar1
Out[39]: array([ 1,  2, 20,  4])

2. 多维数组

对于不是一维是数组，进行索引和切片，就要用英文的逗号 "," 分开来指定每一维的索引

索引

In [41]: ar23 = np.arange(6).reshape(2,3)

In [42]: ar23
Out[42]:
array([[0, 1, 2],
       [3, 4, 5]])

In [44]: ar23[1]
Out[44]: array([3, 4, 5])

In [45]: ar23[0]
Out[45]: array([0, 1, 2])

In [46]: ar23[0][1]
Out[46]: 1

In [47]: ar23[0,1]
Out[47]: 1

切片

In [49]: ar23
Out[49]:
array([[0, 1, 2],
       [3, 4, 5]])

In [50]: ar23[:,2]
Out[50]: array([2, 5])

In [51]: ar23[:,1]
Out[51]: array([1, 4])

In [52]: ar23[1,1]              # 这样只是索引获取值，不是切片
Out[52]: 4

In [56]: ar23[1,1:2]            # 这样才是切片
Out[56]: array([4])

In [57]: ar23[1:2,1]            # 这样也可以
Out[57]: array([4])

In [58]: ar11 = ar23[1:2,1:2]   # 这样可以得到 1 行 1 列的 1 维数组，不建议这么干

In [59]: ar11
Out[59]: array([[4]])           # 这使数据结构更复杂了，扁平胜于嵌套

In [60]: ar11.shape
Out[60]: (1, 1)   

In [75]: ar11[0]                # 嵌套的坏处，使得获取到具体的值更复杂
Out[75]: array([4])

In [76]: ar11[0,0]
Out[76]: 4

In [68]: ar21 = ar23[:,2:3]     # 获得 2 行 1列的 2 维数组

In [69]: ar21
Out[69]:
array([[2],
       [5]])

In [70]: ar21.shape
Out[70]: (2, 1)

In [54]: ar23[1]                # 可以直接切出第几行的全部， 也可以这样 ar23[1,:]， 得到的结果一样
Out[54]: array([3, 4, 5])

10. `ndarray` 高级索引操作

10.1 bool 值索引

ndarray 对象的索引还有个 bool 值索引
默认会把 bool 值为 true 的元素的值获取到

In [82]: arbool  = np.arange(10).reshape(2,5)

In [83]: arbool
Out[83]:
array([[0, 1, 2, 3, 4],
       [5, 6, 7, 8, 9]])

In [84]: arbool[arbool>5]
Out[84]: array([6, 7, 8, 9])

In [85]: art = arbool > 5

In [86]: art
Out[86]:
array([[False, False, False, False, False],
       [False,  True,  True,  True,  True]], dtype=bool)

In [87]: arbool > 5
Out[87]:
array([[False, False, False, False, False],
       [False,  True,  True,  True,  True]], dtype=bool)

In [88]: arbool[art]
Out[88]: array([6, 7, 8, 9])

可以对元素的索引值进行自定义为 True 或 False

In [104]: arbool2 = np.arange(5)

In [105]: arbool2
Out[105]: array([0, 1, 2, 3, 4])

In [106]: arbool2[0:4]
Out[106]: array([0, 1, 2, 3])

In [107]: arbool2[[True,False,False,True,True]]   # 自定义元素的索引值为 True 或 False，                                                  
Out[107]: array([0, 3, 4])                        # 获取到索引值只为 True 的元素值

10.2 `&` 、`|` 与 `~`

& 表示 and 关系
| 表示 or 关系
~ 表示否关系

In [3]: arbool3 = np.arange(10)

In [4]: arbool3
Out[4]: array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [5]: arbool3[(arbool3>5) & (arbool3 % 2 == 0)]     # 大于 5 的数 并且 是偶数
Out[5]: array([6, 8])

In [6]: arbool3[(arbool3>5) | (arbool3 % 2 == 0)]     # 大于 5 的数 和  所有的偶数
Out[6]: array([0, 2, 4, 6, 7, 8, 9])

In [7]: arbool3[~(arbool3>5)]                         # 不大于 5 的数
Out[7]: array([0, 1, 2, 3, 4, 5])

10.3 花式索引

花式索引是利用了切片、索引、bool索引相结合，可以取出数组中的任意想要的行和列，来创建一个新的多维数组

In [13]: arr = np.arange(35).reshape(5,7)

In [14]: arr
Out[14]:
array([[ 0,  1,  2,  3,  4,  5,  6],
       [ 7,  ![8](),  9, 10, 11, 12, 13],
       [14, 15, 16, 17, 18, 19, 20],
       [21, 22, 23, 24, 25, 26, 27],
       [28, 29, 30, 31, 32, 33, 34]])

对于上面的数组

获取 8、11、22、25，组成一个新的二维数组
先通过索引获取到所要的行，再对获取到的行进行切片和索引

In [15]: new1_arr = arr[[1,4]][:,[1,4]]

In [16]: new1_arr
Out[16]:
array([[ 8, 11],
       [29, 32]])

10.4 行索引和列切片结合

In [47]: arr[[False,True,False,False,True],1:3]    # bool 索引必须按位补全bool值，不可少或者多，不然会有警告信息
Out[47]:
array([[ 8,  9],
       [29, 30]])

In [48]: arr[[1,4],1:3]
Out[48]:
array([[ 8,  9],
       [29, 30]])

10.5 花式索引获取到多行的任意列的值，创建一个一维数组

In [49]: arr
Out[49]:
array([[ 0,  1,  2,  3,  4,  5,  6],
       [ 7,  8,  9, 10, 11, 12, 13],
       [14, 15, 16, 17, 18, 19, 20],
       [21, 22, 23, 24, 25, 26, 27],
       [28, 29, 30, 31, 32, 33, 34]])

In [50]: arr[[1,1,4,4],[1,4,1,4]]
Out[50]: array([ 8, 11, 29, 32])

第二行的第二个数，第二行的第五个数
第五行的第二个数，第五行的第五个数

`要向获取到多维的数字，进行花式索引切片时，逗号两遍不可均为索引`

11. 常用函数

先说一下把一个小数转化为整数有以下几种方法

方法 /值	3.4	3.5	-3.4	-3.5	Numpy 函数实现
四舍五入法	3	4	-3	-4	rint
向下取整（去尾法）	3	3	-4	-4	floor
向上取整（进一法）	4	4	-3	-3	ceil
向零取整	3	3	-3	-3	trunc

numpy 实现（一元函数）：

rint

In [68]: arr = np.arange(10,1,-1.4)

In [69]: arr
Out[69]: array([ 10. ,   8.6,   7.2,   5.8,   4.4,   3. ,   1.6])

In [70]: np.rint(arr)
Out[70]: array([ 10.,   9.,   7.,   6.,   4.,   3.,   2.])

floor （译为地板）

In [71]: arr
Out[71]: array([ 10. ,   8.6,   7.2,   5.8,   4.4,   3. ,   1.6])

In [72]: np.floor(arr)
Out[72]: array([ 10.,   8.,   7.,   5.,   4.,   2.,   1.])

ceil (译为天花板)

In [73]: arr
Out[73]: array([ 10. ,   8.6,   7.2,   5.8,   4.4,   3. ,   1.6])

In [74]: np.ceil(arr)
Out[74]: array([ 10.,   9.,   8.,   6.,   5.,   3.,   2.])

trunc

In [75]: arr
Out[75]: array([ 10. ,   8.6,   7.2,   5.8,   4.4,   3. ,   1.6])

In [76]: np.trunc(arr)
Out[76]: array([ 10.,   8.,   7.,   5.,   4.,   2.,   1.])
In [79]: arr2 = np.arange(1,-1,-0.4)

In [80]: arr2
Out[80]: array([ 1. ,  0.6,  0.2, -0.2, -0.6])

In [81]: np.trunc(arr2)
Out[81]: array([ 1.,  0.,  0., -0., -0.])

sqrt 开根号

In [98]: arr3 = np.arange(1,3)

In [99]: arr3
Out[99]: array([1, 2])

In [100]: np.sqrt(arr3)
Out[100]: array([ 1.        ,  1.41421356])

abs 绝对值

In [86]: arr2
Out[86]: array([ 1. ,  0.6,  0.2, -0.2, -0.6])

In [87]: np.abs(arr2)
Out[87]: array([ 1. ,  0.6,  0.2,  0.2,  0.6])

modf 对一个含有浮点数的数组进行分割，分割为整数部分和小数部分两个数组

In [223]: modfa = np.arange(1,5,1.2)

In [224]: modfa
Out[224]: array([ 1. ,  2.2,  3.4,  4.6])

In [225]: np.modf(modfa)
Out[225]: (array([ 0. ,  0.2,  0.4,  0.6]), array([ 1.,  2.,  3.,  4.]))

In [226]: modf = np.modf(modfa)

In [227]: modf[0]
Out[227]: array([ 0. ,  0.2,  0.4,  0.6])

In [228]:

In [228]: modf[1]
Out[228]: array([ 1.,  2.,  3.,  4.])

In [234]: modf[0][:2]
Out[234]: array([ 0. ,  0.2])

isnan 先说 nan 是 not a number ，意思是不是一个数

In [151]: arr
Out[151]: array([0, 2, 3, 4])

In [152]: arr2
Out[152]: array([0, 1, 2, 3])

In [153]: nan1 = arr/arr2
/Users/yanshunjun/.pyenv/versions/anaconda3-4.4.0/bin/ipython:1: RuntimeWarning: invalid value encountered in true_divide
  #!/Users/yanshunjun/.pyenv/versions/anaconda3-4.4.0/bin/python

In [154]: nan1
Out[154]: array([        nan,  2.        ,  1.5       ,  1.33333333])

In [155]: nan1[np.isnan(nan1)]          # 找到 nan
Out[155]: array([ nan])

In [156]: nan1[~np.isnan(nan1)]         # 排除 nan
Out[156]: array([ 2.        ,  1.5       ,  1.33333333])

isinf 是一个无穷大的数

In [174]: a
Out[174]: array([1, 2, 3, 4])

In [175]: b
Out[175]: array([0, 1, 2, 3])

In [176]: c = a / b
/Users/yanshunjun/.pyenv/versions/anaconda3-4.4.0/bin/ipython:1: RuntimeWarning: divide by zero encountered in true_divide
  #!/Users/yanshunjun/.pyenv/versions/anaconda3-4.4.0/bin/python

In [177]: c
Out[177]: array([        inf,  2.        ,  1.5       ,  1.33333333])

In [178]: np.isinf(c)
Out[178]: array([ True, False, False, False], dtype=bool)

还有一些二元函数

maximum 对两个同样形状的数组中的每个元素进行 max 运算，返回一个最大值

In [114]: arr
Out[114]: array([ 10.,   8.,   7.,   5.,   4.])

In [115]: arr2
Out[115]: array([ 20. ,  20. ,   0.2,  -0.2,  -0.6])

In [116]: np.maximum(arr,arr2)
Out[116]: array([ 20.,  20.,   7.,   5.,   4.

mininmum 求两个同样形状是数组的最小值

In [118]: arr
Out[118]: array([ 10.,   8.,   7.,   5.,   4.])

In [119]: arr2
Out[119]: array([ 20. ,  20. ,   0.2,  -0.2,  -0.6])

In [120]: np.minimum(arr,arr2)
Out[120]: array([ 10. ,   8. ,   0.2,  -0.2,  -0.6])

12. 常用科学和统计方法

下面这些方法是对于一个数组来使用的，通过 . 方式调用

sum 求和

In [165]: a
Out[165]: array([7, 8, 2, 6, 1, 5, 4, 3, 9])

In [166]: a.sum()
Out[166]: 45

cusum 求所有元素的累计和，接收的不论是几维数组，返回的始终是一个一维数组

In [183]: arr
Out[183]:
array([[0, 1, 2, 3, 4],
       [5, 6, 7, 8, 9]])

In [184]: arr.cumsum()
Out[184]: array([ 0,  1,  3,  6, 10, 15, 21, 28, 36, 45])

In [189]: arr5 = np.arange(9).reshape(3,3)

In [190]: arr5
Out[190]:
array([[0, 1, 2],
       [3, 4, 5],
       [6, 7, 8]])

In [191]: arr5.cumsum()
Out[191]: array([ 0,  1,  3,  6, 10, 15, 21, 28, 36])

mean 求平均数

In [167]: a.mean()
Out[167]: 5.0

min 求最小值

In [168]: a.min()
Out[168]: 1

max 求最大值

In [169]: a.max()
Out[169]: 9

argmin 求最小值的索引

In [170]: a.argmin()
Out[170]: 4

argmax 求最大值的索引

In [171]: a.argmax()
Out[171]: 8

var 求方差

什么是方差

方差就是求一组数的离散程度
比如有这样一组数 5、4、3、2、1
方法:
用这组数中的每一个数去减去这组数的平均值，再用这个得出来的差值求平方，就这样得到每个元素这样算出来的平方数相加之和再除以这组数的元素数
((5-3)2 + (4-3)2 + (3-3)2 + (2-3)2 + (1-3)**2 )/5

In [202]: va = np.arange(5,0,-1)

In [203]: va
Out[203]: array([5, 4, 3, 2, 1])

In [204]: va.var()
Out[204]: 2.0  

In [193]: va2 = np.zeros(5)+3

In [194]: va2
Out[194]: array([ 3.,  3.,  3.,  3.,  3.])

In [195]: va2.var()
Out[195]: 0.0

std 求标准差

什么是标准差

标准差就是方差开根号

In [213]: va
Out[213]: array([5, 4, 3, 2, 1])

In [214]: va.var()
Out[214]: 2.0

In [215]: c = va.var()

In [216]: va.std()
Out[216]: 1.4142135623730951

In [217]: np.sqrt([c])
Out[217]: array([ 1.41421356])

13. Numpy 随机生成数 `random`

rand
返回 0.0 到 1.0 的随机数，组成一个一维数组，只接收一个参数

In [239]: np.random.rand(5)
Out[239]: array([ 0.93476534,  0.93881936,  0.15654494,  0.64855116,  0.00933524])

random
返回 0.0 到 1.0 的随机数，组成一个多维数组，只接收一个元组的参数

In [242]: np.random.random((2,5))
Out[242]:
array([[ 0.97400618,  0.94829591,  0.23247149,  0.60995674,  0.31937055],
       [ 0.50170312,  0.71082459,  0.34595982,  0.87529154,  0.21735688]])

randint
返回一个给定的连续的整数范围内的一个数组，接收一个整数参数或者一个表示形状的元组

In [243]: np.random.randint(1,10, 5)
Out[243]: array([2, 5, 3, 2, 1])

In [244]: np.random.randint(1,10, (2, 5))
Out[244]:
array([[7, 3, 6, 2, 9],
       [3, 1, 1, 1, 8]])

choice
返回一个给定的非连续的随机的数字列表范围内的一个数组，接收一个整数参数或者一个元组

In [247]: np.random.choice([1,5,7,10,1.6,30],3)
Out[247]: array([ 1.,  7.,  5.])

In [248]: np.random.choice([1,5,7,10,1.6,30],(2,3))
Out[248]:
array([[  1.,  10.,   7.],
       [ 30.,  10.,   1.]])

shuffle
把一个给定的列表或者一个给定 Numpy 的数组中的元素位置打乱

In [153]: a = np.arange(1,10)

In [154]: a
Out[154]: array([1, 2, 3, 4, 5, 6, 7, 8, 9])

In [155]: b
Out[155]: [1, 2, 3, 4, 5, 6]

In [156]: np.random.shuffle(a)

In [157]: a
Out[157]: array([7, 8, 2, 6, 1, 5, 4, 3, 9])

In [158]: np.random.shuffle(b)

In [159]: b
Out[159]: [4, 6, 2, 3, 5, 1]

uniform

In [173]: np.random.uniform([1.0,5.0], 2)
Out[173]: array([ 1.10986969,  4.05806047])

Python3 和金融之 NumPy 篇
Python3 和金融简单介绍如何使用Python进行量化投资？自己编写：NumPy+pandas+Matpl...
Mac--Python3.5安装Numpy库
python3 -m pip install numpy
统计数第三周——实践
本周的主要内容是python代码实践基于numpy和pandas. 由于已经完成了python3以及numpy和p...
ubuntu +python3
建立虚拟环境的时候 python3 + numpy 参考资料：Python环境配置numpy/scipy/matp...
python3 pandas模块
python3 pandas模块 numpy能够帮助我们处理数值，但是pandas除了处理数值之外(基于numpy...
安装基于Python3 的NumPy, SciPy和Scikit
原文来自：安装基于Python3 的NumPy, SciPy和Scikit-Learn 1. 安装Pyhton 3...
NumPy之索引技巧
系列文章一次性搞定NumPy入门基础知识NumPy之操控ndarray的形状NumPy之浅拷贝和深拷贝NumPy...
64位Win7搭建Python开发平台Python3 + Ipy
64位Win7搭建Python开发平台（Python3 + Ipython Notebook + Numpy + ...
python3 numpy模块
python3 numpy模块什么是numpy？一个在Python中做科学计算的基础库，重在数值计算，也是大部...
Python学习给照片换底色(蓝底换红底)
环境要求 Python3 numpy函数库 opencv库安装下载适应版本的numpy函数库，我电脑是WIN1...

Python3 和金融 之 NumPy 篇