美文网首页我爱编程
科学计算工具-numpy

科学计算工具-numpy

作者: 卢子野 | 来源:发表于2018-01-22 21:38 被阅读0次

    简介

    Numpy:提供了一个在Python中做科学计算的基础库,重在数值计算,主要用于多维数组(矩阵)处理的库。
    用来存储和处理大型矩阵,比Python自身的嵌套列表结构要高效的多。
    本身是由C语言开发,是个很基础的扩展,Python其余的科学计算扩展大部分都是以此为基础。
    高性能科学计算和数据分析的基础包
    ndarray,多维数组(矩阵),具有矢量运算能力,快速、节省空间
    矩阵运算,无需循环,可完成类似Matlab中的矢量运算
    线性代数、随机数生成

    #导入
    import numpy as np
    

    数组创建

    NumPy数组是一个多维的数组对象(矩阵),称为ndarray,具有矢量算术运算能力,并具有执行速度快和节省空间的特点。

    注意:ndarray的下标从0开始,且数组里的所有元素必须是相同类型

    ndarray属性

    • ndim属性:维度个数
    • shape属性:维度大小
    • dtype属性:数据类型

    ndarray的随机创建

    通过随机抽样(numpy.random)生成随机数据

    np.random.rand()
    随机样本位于[0,1)中,rand固定取件0.0~1.0

    1-1

    np.random.randn()
    随机样本是从标准正态分布中返回一个或多个样本值

    1-2

    np.random.randint()
    生成指定维度大小(3行4列)的随机多维整型数据(二维),randint()可以指定区间(-1, 5)

    1-3

    np.random.uniform()
    生成指定维度大小(3行4列)的随机多维浮点型数据(二维),uniform()可以指定区间(-1, 5)

    1-4

    ndarray的序列创建

    np.array(collection)
    collection为序列型对象(list)、嵌套序列对象(list of list)

    #list序列转换为ndarray
    list = range(10)
    arr = np.array(list)
    print(arr)#ndarray数据
    print(type(arr))
    
    2-1

    np.zeros()指定大小的全0数组。注意第一个参数是数组,用来指定大小,如(3,4)

    zeros_arr = np.zeros((3,4))
    
    2-2

    np.ones()
    指定大小全是1的数组,注意:第一个参数是远足,用来指定大小,如(3,4)

    np.ones()
    
    2-3

    np.empty()
    初始化数组,不是总是返回全0,有时返回的是未初始化的随机值(内存里的随机值)

    #np.empty
    empty_arr = np.empty((3,3))
    #np.empty 指定数据类型
    empty_int_arr = np.empty((3,3),int)
    
    2-4

    np.arange()和reshape()
    arange()类似python的range(),创建一个一维ndarray数组
    reshape将重新调整数组的维数

    # np.arange() 
    arr = np.arange(15) # 15个元素的 一维数组 
    print(arr) 
    print(arr.reshape(3, 5)) # 3x5个元素的 二维数组
    print(arr.reshape(1, 3, 5)) # 1x3x5个元素的 三维数组
    
    
    2-5

    ndarray数据类型

    dtype参数
    指定数组的数据类型,类型名+位数,如float64,int32

    #初始化3行4列数组,数据类型为float64
    zeros_float_arr = np.zeros((3,4),dtype=np.float64)
    print(zeros_float_arr)
    
    3-1

    astype方法

    #astype转换数据类型,将已有的数组的数据类型转换为int32
    zeros_int_arr = zeros_float_arr.astype(np.int32) 
    print(zeros_int_arr) 
    print(zeros_int_arr.dtype)
    
    
    
    3-2

    ndarray的矩阵运算

    数组是编程中的概念,矩阵、矢量是数学概念。

    在计算机编程中,矩阵可以用数组形式定义,矢量可以用结构定义!

    1.矢量运算:相同大小的数组间运算应用在元素上

    #矢量与矢量运算
    arr = np.array([[1,2,3],[4,5,6]])
    print("元素相乘:")
    print(arr*arr)
    print("矩阵相加:")
    print(arr + arr)
    
    4-1

    2.矢量和标量运算:"广播"-将标量"广播"到各个元素

    #矢量与标量运算
    arr = np.array([[1,2,3],[4,5,6]])
    print(1./arr)
    print(2.*arr)
    
    4-2
    ndarray的索引与切片

    1.一维数组的索引与切片-与python的列表索引功能相似

    #一维数组
    arr1 = np.arange(10)
    print(arr1)
    print(arr1[2:5])
    
    5-1

    2.多维数组的索引与切片

    arr2 = np.random.randint(1,5,size(3,5))
    print(arr2)
    print(arr2[2:3])
    
    5-2

    3.条件索引
    布尔值多维数组:arr[condition],condition也可以是多个条件组合。
    注意,多个条件组合要使用 & | 连接,而不是Python的 and or。

    # 条件索引 找出 data_arr 中 2005年后的数据 
    data_arr = np.random.rand(3,3) 
    print(data_arr) 
    year_arr = np.array([[2000, 2001, 2000], [2005, 2002, 2009], [2001, 2003, 2010]]) 
    is_year_after_2005 = year_arr >= 2005 
    print(is_year_after_2005, is_year_after_2005.dtype)
    
    
    5-3
    filtered_arr = data_arr[is_year_after_2005] 
    print(filtered_arr) 
    # 多个条件 
    filtered_arr = data_arr[(year_arr <= 2005) & (year_arr % 2 == 0)] 
    print(filtered_arr)
    
    
    5-4
    ndarray的转置

    二维数组直接使用转换函数:transpose()
    高维数组转换要指定维度编号参数 (0, 1, 2, …),注意参数是元组

    arr = np.random.rand(2,3) # 2x3 数组 
    print(arr) 
    print(arr.transpose()) # 转换为 3x2 数组 
    
    5-5
    arr3d = np.random.rand(2,3,4) # 2x3x4 数组,2对应0,3对应1,4对应2 
    print(arr3d) 
    print(arr3d.transpose((1,0,2))) # 根据维度编号,转为为 3x2x4 数组
    
    5-6

    元素计算函数

    • ceil(): 向上最接近的整数,参数是 number 或 array
    • floor(): 向下最接近的整数,参数是 number 或 array
    • rint(): 四舍五入,参数是 number 或 array
    • isnan(): 判断元素是否为 NaN(Not a Number),参数是 number 或 array
    • multiply(): 元素相乘,参数是 number 或 array
    • divide(): 元素相除,参数是 number 或 array
    • abs():元素的绝对值,参数是 number 或 array
    • where(condition, x, y): 三元运算符,x if condition else y
    # randn() 返回具有标准正态分布的序列。 
    arr = np.random.randn(2,3) 
    print(arr) 
    print(np.ceil(arr)) 
    print(np.floor(arr)) 
    print(np.rint(arr)) 
    
    
    6-1
    print(np.isnan(arr)) 
    print(np.multiply(arr, arr)) 
    print(np.divide(arr, arr)) 
    print(np.where(arr > 0, 1, -1))
    
    6-2

    元素统计函数

    • np.mean(), np.sum():所有元素的平均值,所有元素的和,参数是 number 或 array
    • np.max(), np.min():所有元素的最大值,所有元素的最小值,参数是 number 或 array
    • np.std(), np.var():所有元素的标准差,所有元素的方差,参数是 number 或 array
    • np.argmax(), np.argmin():最大值的下标索引值,最小值的下标索引值,参数是 number 或 array
    • np.cumsum(), np.cumprod():返回一个一维数组,每个元素都是之前所有元素的 累加和 和 累乘积,参数是 number 或 array
    • 多维数组默认统计全部维度,axis参数可以按指定轴心统计,值为0则按列统计,值为1则按行统计。
    arr = np.arange(12).reshape(3,4) 
    print(arr) 
    print(np.sum(arr)) # 所有元素的和 
    print(np.sum(arr, axis=0)) # 数组的按列统计和 
    print(np.sum(arr, axis=1)) # 数组的按行统计和
    print(np.cumsum(arr)) # 返回一个一维数组,每个元素都是之前所有元素的 累加和 
    
    7-1
    arr = np.random.randint(0,10,(3,4))
    print(arr)
    #所有元素的平均值与和
    print(np.mean(arr))
    print(np.sum(arr))
    #求数组的最大值
    print(np.max(arr))
    print(np.min(arr))
    #方差和标准差:衡量数据和期望值之间的偏离值
    #求方差:所有元素都和平均数的差的平方的平均数
    print(np.var(arr))
    #求标准差:方差的平方根
    print(np.std(arr))
    
    
    7-2
    #求最大值和最小值的索引下标
    #如果是多维数组,将多维数组合并成一维数组,再找出最大值索引下标
    arr = np.arange(10)
    print(arr)
    print(np.argmax(arr))
    print(np.argmin(arr))
    #返回一维数组,数组每个元素都是之前每个元素的累加和
    print(np.cumsum(arr))
    #返回一个一维数组,数组的每一个元素都是之前所有元素的累加积
    print(np.cumprod(arr))
    
    7-3

    相关文章

      网友评论

        本文标题:科学计算工具-numpy

        本文链接:https://www.haomeiwen.com/subject/fhyraxtx.html