美文网首页
Python NumPy用法

Python NumPy用法

作者: 懒听夏 | 来源:发表于2020-09-21 14:16 被阅读0次

    原文作者:无味之味
    链接:https://www.jianshu.com/p/49d5bd1c2572
    来源:简书
    著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

    本文在原作者基础上添加小小小更新

    介绍

    NumPy是Python数值计算最重要的基础包,大多数提供科学计算的包都是用NumPy的数组作为构建基础。NumPy本身并没有提供多么高级的数据分析功能,理解NumPy数组以及面向数组的计算,将有助于你更加高效地使用诸如Pandas之类的工具。
    虽然NumPy提供了通用的数值数据处理的计算基础,但大多数读者可能还是想将Pandas作为统计和分析工作的基础,尤其是处理表格数据时。

    NumPy的部分功能如下:

    • ndarray,一个具有矢量算术运算复杂广播能力的快速且节省空间的多维数组
    • 用于对整组数据进行快速运算的标准数学函数(无需编写循环)。
    • 用于读写磁盘数据的工具以及用于操作内存映射文件的工具。
    • 线性代数随机数生成以及傅里叶变换功能。
    • 用于集成由C、C++、Fortran等语言编写的代码的A C API。

    NumPy之于数值计算特别重要是因为它可以高效处理大数组的数据。这是因为:

    • 比起Python的内置序列(list),NumPy数组使用的内存更少。
    • NumPy可以在整个数组上执行复杂的计算,而不需要Python的for循环。

    使用下面格式约定,引入NumPy包:

    import numpy as np
    

    NumPy的ndarray:N维数组对象

    NumPy最重要的是其N维数组对象(即ndarray),其中的所有元素必须是相同类型的。该对象是一个快速而灵活的大数据集容器,可以利用这种数组对整块数据执行数学运算,其语法跟标量元素之间的运算一样。

    创建ndarray

    • 使用np.array(list/tuple, dtype=np.float32)函数,产生一个新的含有传入数据的ndarray对象。
      第一个参数为元组、列表(相同数据类型),第二个参数为ndarray数组中的数据类型。当第二个参数为空时,NumPy将根据数据情况指定一个类型。
      返回值为[ ]形式,元素间由空格分割。
    In [20]: arr1 = np.array([6, 7.5, 8, 0, 1])   #从列表创建
    ​In [21]: pring(arr1)
    Out[21]: [ 6. ,  7.5,  8. ,  0. ,  1. ]     #NumPy根据数据情况,指定了float类型
    
    ​In [23]: arr2 = np.array([[1, 2, 3, 4], [5, 6, 7, 8],(1.2 , 2.3)])
    ​In [24]: pring(arr2)
    Out[24]: [[1, 2, 3, 4] [5, 6, 7, 8] (1.2 , 2.3)]
    
    • 使用np.asarray(list/tuple, dtype=np.float32)函数,使用方法类似array
    a = np.array([1, 2, 3, 4, 5])   #从列表创建
    ​a1 = np.array(a) #深拷贝
    a2 = np.asarray(a) #浅拷贝
    a[0] = 100
    a1 = [1 2 3 4 5]
    a2 = [100   2   3   4   5]
    
    • 使用NumPy中的内置函数
      np.arange(begin,end,step,dtype=np.float32):begin为元素起始值(包含),end为元素结束值(不包含),step为步长(默认值为1),dtype为元素类型。如果只有一个参数n,则为从0到n-1;如有有两个参数n和m,则为从n到m-1(等步长)
      np.linspace(begin,end,number):创建包含number个元素的数组,并在指定的开始值(包含)和结束值(包含)之间平均间隔(等间隔)
      np.ones(shape):根据shape生成一个全1数组,shape是元组类型,比如(2,3);
      np.zeros(shape):根据shape生成一个全0数组,shape是元组类型,比如(2,3,4);
      np.full(shape,val):根据shape生成一个数组,每个元素值都是val;
      np.eye(n):创建一个正方的n*n单位矩阵,对角线为1,其余为0;
      np.ones_like(a): 根据数组a的形状生成一个全1数组;
      np.zeros_like(a): 根据数组a的形状生成一个全0数组;
      np.full_like(a,val): 根据数组a的形状生成一个每个元素值都是val的数组;
      np.concatenate(): 将两个或多个数组合并成一个新的数组。
    In [30]: arr3 = np.zeros((3, 6))
    In [31]: print(arr3)
    Out[30]: [[ 0.,  0.,  0.,  0.,  0.,  0.] [ 0.,  0.,  0.,  0.,  0.,  0.] [ 0.,  0.,  0.,  0.,  0.,  0.]]
    
    • 从磁盘读取数据创建ndarray数组,将ndarray数组保存到磁盘(大部分情况会使用pandas或其它工具加载文本或表格数据)
      np.load(fname)
      • fname : 文件名,以.npy为扩展名,压缩扩展名为.npz
      np.save(fname, array) 或 np.savez(fname, array)
      • fname : 文件名,以.npy为扩展名,压缩扩展名为.npz
      • array : 数组变量

    ndarray数组对象的属性

    • .ndim:秩,即轴的数量或维度的数量
    • .shape:ndarray对象的尺度,对于矩阵,n行m列
    • .size:ndarray对象元素的个数,相当于.shape中n*m的值
    • .dtype:ndarray对象的元素类型
    • .itemsize:ndarray对象中每个元素的大小,以字节为单位

    ndarray数组对象的类型和维度变换

    • .astype(np.float64):将ndarray数组元素从一个类型转换成另一个类型,返回一个新数组
      如果将浮点数转换成整数,则小数部分将会被截取删除。(类型变换)
    • .reshape(shape, order):不改变原数组,返回一个新的shape维度的数组(当shape=[-1,n]/[n,-1]的时候,n为能整除的数,否则报错,意义为不知道多少行,n列,n行,不知道多少列) (维度变换)
    • .resize(shape):与.reshape()功能一致,但修改原数组(维度变换)
    • .T:属性,行列互换(行列转置)
    a=np.array([[1,2,3],[2,3,4],[5,6,7],[6,7,8]])
    a
    array([[1, 2, 3],
           [2, 3, 4],
           [5, 6, 7],
           [6, 7, 8]])
    a.T
    array([[1, 2, 5, 6],
           [2, 3, 6, 7],
           [3, 4, 7, 8]])
    
    • .swapaxes(ax1,ax2): 将数组n个维度中两个维度进行调换(维度变换)
    • .flatten():对数组进行降维,返回折叠后的一维数组,原数组不变(维度变换)
    • .tolist():将N维数组转换成列表(维度变换)
    • .unique() 数组去重
    In: temp = np.array([1,2,3,4],[2,3,4,5])
    In: np.unique(temp)
    Out: array([1,2,3,4,5])
    

    ndarray数组的索引和切片

    具体使用参考

    https://seancheney.gitbook.io/python-for-data-analysis-2nd/di-04-zhang-numpy-ji-chu-shu-zu-he-shi-liang-ji-suan#ji-ben-de-suo-yin-he-qie-pian
    https://docs.scipy.org/doc/numpy/user/quickstart.html#indexing-slicing-and-iterating
    https://blog.csdn.net/zheng_weibin/article/details/79358986

    ndarray数组的运算

    • 数组与标量之间的运算,都会作用于数组的每一个元素;
    • 大小相同的数组之间的任何算术运算,都会将运算应用到元素级;
    • 大小相同的数组之间的比较运算,都会将运算应用到元素级并生成布尔值数组;
    • np.abs(arr)\np.fabs(arr):计算数组arr各元素的绝对值
    • np.sqrt(arr):计算数组arr各元素的平方根
    • np.square(arr):计算数组arr各元素的平方
    • np.log(arr)\np.log10(arr)\np.log2(arr):计算数组arr各元素的自然对数、10底对数和2底对数
    • np.ceil(arr)\np.floor(arr):计算数组arr各元素的ceiling值 或 floor值
    • np.rint(arr): 计算数组arr各元素的四舍五入值
    • np.modf(arr): 将数组arr各元素的小数和整数部分以两个独立数组形式返回
    • np.cos(arr)\np.cosh(arr)\np.sin(arr)\np.sinh(arr)\np.tan(arr)\np.tanh(arr):计算数组arr各元素的普通型和双曲型三角函数
    • np.exp(arr): 计算数组arr各元素的指数值
    • np.sign(arr): 计算数组arr各元素的符号值,1(+), 0, ‐1(‐)

    利用ndarray进行数据处理

    排序

    ndarray数组通过.sort()函数排序,多维数组时传入轴编号
    NumPy的随机数函数

    • np.random.rand(d0,d1,..,dn):根据d0‐dn创建随机数数组,浮点数,范围在[0.0,1.0),均匀分布。
    • np.random.randn(d0,d1,..,dn):根据d0‐dn创建随机数数组,标准正态分布。
    • np.random.randint(low,high=none,size=None,dtype=int):随机整形数组,按官方文档,若low,high只给一个的时候,默认为最高值,size可为整数或shape。
    In:  m = np.random.randint(2, size=10)
         m
    Out: array([0, 1, 1, 1, 1, 1, 1, 0, 1, 0])
    
    In:  n = np.random.randint(5, size=(2, 4))
         n
    Out: array([[2, 1, 1, 1],
            [2, 2, 0, 1]])
    
    • np.random.seed(s):随机数种子,s是给定的种
    • np.random.shuffle(a):根据数组a的第1轴进行随排列,改变数组x
    • np.random.permutation(a):根据数组a的第1轴产生一个新的乱序数组,不改变数组x
    • np.random.choice(a[,size,replace,p]):从一维数组a中以概率p抽取元素,形成size形状新数组 replace表示是否可以重用元素,默认为False
    • np.random.uniform(low,high,size):产生具有均匀分布的数组,low起始值,high结束值,size数据个数(常用)
    • np.random.normal(loc,scale,size):产生具有正态分布的数组,loc均值,scale标准差,size数据个数(常用)
    • np.random.poisson(lam,size):产生具有泊松分布的数组,lam随机事件发生率,size形状

    NumPy的统计类函数

    • np.sum(a, axis=None):根据给定轴axis计算数组a相关元素之和,axis整数或元组
    • np.mean(a, axis=None):根据给定轴axis计算数组a相关元素的期望,axis整数或元组
    • np.average(a,axis=None,weights=None):根据给定轴axis计算数组a相关元素的加权平均值
    • np.std(a, axis=None):根据给定轴axis计算数组a相关元素的标准差
    • np.var(a, axis=None):根据给定轴axis计算数组a相关元素的方差
    • np.min(a)\max(a):计算数组a中元素的最小值、最大值
    • np.argmin(a)\argmax(a):计算数组a中元素最小值、最大值的降一维后下标
    • np.unravel_index(index, shape):根据shape将一维下标index转换成多维下标
    • np.ptp(a):计算数组a中元素最大值与最小值的差
    • np.median(a):计算数组a中元素的中位数(中值)

    NumPy的梯度函数

    梯度:连续值之间的变化率,即斜率
    XY坐标轴连续三个X坐标对应的Y轴值:a, b, c,其中,b的梯度是: (c‐a)/2

    • np.gradient(f):计算数组f中元素的梯度,当f为多维时,返回每个维度梯度

    原文作者:无味之味
    链接:https://www.jianshu.com/p/49d5bd1c2572
    来源:简书
    著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

    相关文章

      网友评论

          本文标题:Python NumPy用法

          本文链接:https://www.haomeiwen.com/subject/qehvyktx.html