美文网首页
numpy 笔记

numpy 笔记

作者: 薛东弗斯 | 来源:发表于2018-04-15 07:12 被阅读0次

    Numpy是什么

    Numpy(Numerical Python)是一个开源的Python科学计算库,包含很多实用的数学函数,线性代数运算,傅里叶变换等

    现在用python搞数据分析或机器学习经常使用的pandas、matplotlib、sklearn等库,都需要基于numpy构建

    Numpy beginner's guide.png

    Numpy能够直接对数组和矩阵进行操作,运算效率优于Python提供的list容器

    ** Numpy模块里的函数帮助请求**

    Paste_Image.png

    importnumpyasnp#help()help(np.arange)#?方法# np.arange?

    数组对象

    Numpy数组一般是同质的,即数组中的所有元素类型必须是一致的

    Numpy数组下标也是从0开始的

    ndarray是numpy的核心数据结构。ndarray如何在内存中储存的:关于数组的描述信息保存在一个数据结构中,这个结构引用两个对象,一块用于保存数据的存储区域和一个用于描述元素类型的dtype对象

    关于ndarray的索引方式,有以下几个重点需要记住:

    虽然x[0,2] = x0,但是前者效率比后者高,因为后者在应用第一个索引后需要先创建一个temporary array,然后再应用第二个索引,最后找到目标值。

    分片操作不会引发copy操作,而是创建原ndarray的view;他们所指向的内存是同一片区域,无论是修改原ndarray还是修改view,都会同时改变二者的值。

    index array和boolean index返回的是copy,不是view。

    ** 部分函数操作**

    改变数组维度

    Paste_Image.png

    importnumpyasnp b = np.arange(24).reshape(2,3,4)#ravel展平数组的操作b.ravel()#array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16,17,18,19,20,21,22,23])'''

    flatten也是展平操作,与ravel功能相同,

    差异在于flatten会请求分配内存保存结果,

    而ravel只是返回一下view

    '''b.flatten()#reshape用一正整数元组设置数组的维度b.reshape(4,6)#resize 与reshape功能一样,resize会直接修改所操作的数组b.resize((2,12))b#transpose转置矩阵b.transpose()

    数组的组合

    Numpy数组有水平组合,垂直组合和深度组合等多种组合方式:vstack, dstack, hstack, column_stack, row_stack及concatenate函数。

    ndarray_stack.png

    importnumpyasnpa = np.arange(9).reshape(3,3)b =2*a'''

    a =  [[0 1 2]

    [3 4 5]

    [6 7 8]]

    b =  [[ 0  2  4]

    [ 6  8 10]

    [12 14 16]]

    '''#水平组合,与np.concatenate((a,b), axis=1)功能相同np.hstack((a,b))# array([[ 0,  1,  2,  0,  2,  4],[3,4,5,6,8,10],      [6,7,8,12,14,16]])#垂直组合,与np.concatenate((a,b), axis=0)相同np.vstack((a, b))# array([[ 0,  1,  2],[3,4,5],      [6,7,8],      [0,2,4],      [6,8,10],      [12,14,16]])# 深度组合,将一系统数组沿着纵轴方向进度层叠组合np.dstack((a, b))# array([[[ 0,  0],[1,2],        [2,4]],      [[3,6],        [4,8],        [5,10]],      [[6,12],        [7,14],        [8,16]]])#列组合, 与hstack效果相同np.column_stack((a, b))#行组合,与vstack效果相同的np.row_stack((a, b))

    *数组的分割

    Numpy可以对数组进行水平,垂直或深度分割:hsplit, vsplit, dsplit和split,可将数组分割成相同大小的子数组,也可指定原数组中需要分割的位置

    Paste_Image.png

    #水平分割,与np.split(a, 3, axis=1)相同np.hsplit(a, 3)#垂直分割,与np.split(a, 3, axis=0)相同np.vsplit(a, 3)#深度分割,按深度方向分割数组c = np.arange(27).reshape(3,3,3)np.dsplit(c, 3)

    数组的属性

    Paste_Image.png

    shape,数组的形状

    dtype,数据类型

    ndim,维数或数组轴的个数

    size,数组元素总个数

    itemsize,数组元素在内存中所占的字节数

    nbytes,整个数组所占的存储空间

    T,转置,与transpose一样

    在numpy中,复数的虚部是用j来表示的

    在复数中:real属性,imag属性分别取得数组的实部与虚部

    flat,将返回一个numpy.flatiter对象,可遍历

    数组的转换

    tolist:将Numpy数组转换成Python列表

    astype:可在转换数组时指定数据类型

    Numpy读写文件

    #写:函数将数据a存储到test.txt文件中np.savetxt('test.txt', a)'''

    表示读取test.csv文件,分隔符设置

    为‘,’(delimiter=','),usecols表示

    取得哪几列数据,unpack=True表示分

    拆存储不同列的数据,即分别将第6列与

    第7列数据赋值给变量x,y

    '''x, y = np.loadtxt('test.csv', delimiter=',', usecols=(6,7), unpack=True)

    数据分析常用的函数

    #加权平均,v作为权重参数np.average(c, weights=v)#算术平均np.mean(c)#取值范围np.max(c)np.min(c)#ptp函数返回最大值与最小值之间的差值np.ptp(c)#median函数返回中位数np.median(c)#var方差np.var(c)#diff函数返回一个由相邻数组元素的差值构成的数组np.diff(c)#std函数计算标准差np.std(c)#where函数根据指定的条件返回所有满足条件的数组元素的索引值idx = np.where(c>6)# take函数按照索引值从数组中取出相应的元素,np.take(c,np.where(c>6))data = np.take(idx)#argmin返回是c数组中最小元素的索引值,argmax返回最大值索引值np.argmin(c)np.argmax(c)#maximum函数可返回多个数组里的各最大值np.maximum(a, b, c)#同理minximum返回最小值#exp函数可计算每个数组元素的指数np.exp(x)#linspace(s, e, [n])函数起始s, 终止e,个数n(可选),返回一个元素值在指定的范围内均匀分布的数组np.linspace(-1,0,5)#fill函数,将数组元素的值全部设置为一个指定的标量值

    数组修剪和压缩

    #clip方法将所有比给定最大值还大的#元素全部设为给定的最大值,而所有#比给定最小值还小的元素全部设定为给定的最小值a = np.arange(5)a.clip(1,2)#compress方法返回一个根据给定条件筛选后的数组a = np.arange(4)a.compress(a>2)#[3]

    阶乘

    #prod计算数组中所有元素的乘积b = np.arange(1, 9)print("b =", b)print("Factorial", b.prod())#b = [1 2 3 4 5 6 7 8]#Factorial 40320#cumprod方法,计算数组元素的累积乘积b.cumprod()#[ 1 2 6 24 120 720 5040 40320]

    相关性

    #协方差,描述两个变量共同变化趋势c = np.cov(a,b)#diagonal返回对角线上的元素c.diagonal()#trace计算矩阵的迹,即对角线上元素之和c.trace()#corrcoef函数计算相关系数(或者更精确地,相关系数矩阵)np.corrcoef(a, b)

    判断数组里数据正负性

    Paste_Image.png

    #sign函数可以返回数组中每个元素的正负符号,#数组元素为负时返回-1,为正时返回1,否则返回0np.sign(c)#piecewise函数来获取数组元素的正负。piecewise函数可以分段给定取值np.piecewise(c,[c>0, c<0],[-1,1])

    ‘’乘与dot函数*

    NumPy中的乘法运算符 *指示按元素计算,矩阵乘法可以使用 dot函数

    importnumpyasnpa = np.arange(6).reshape(2,3)'''

    [[0 1 2]

    [3 4 5]]

    '''b = np.arange(-3,3).reshape(2,3)'''

    [[-3 -2 -1]

    [ 0  1  2]]

    '''bb = b.reshape(3,2)'''

    [[-3 -2]

    [-1  0]

    [ 1  2]]

    '''ab = a * bprint('a*b result is ', ab)'''

    [

    [ 0 -2 -2]

    [ 0  4 10]

    ]

    '''a_bb = np.dot(a, bb)print('a.*b result is ', a_bb)'''

    [

    [ 1  4]

    [-8  4]

    ]

    '''

    其他函数

    trim_zeros:去掉一维数组中开头和末尾为0的元素

    其它函数array, zeros, zeros_like, ones, ones_like, empty, empty_like, arange, linspace, rand, randn, fromfunction, fromfile参考:NumPy示例

    作者:深思海数_willschang

    链接:https://www.jianshu.com/p/81501a85d406

    來源:简书

    著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

    相关文章

      网友评论

          本文标题:numpy 笔记

          本文链接:https://www.haomeiwen.com/subject/rezrkftx.html