= 1) in me...">
美文网首页
numpy中的np.ascontiguousarray()函数

numpy中的np.ascontiguousarray()函数

作者: 程序员MONTE | 来源:发表于2020-06-15 12:40 被阅读0次

Numpy文档中的说明:

"Return a contiguous array (ndim >= 1) in memory (C order)."

用途

ascontiguousarray函数将一个内存不连续存储的数组转换为内存连续存储的数组,使得运行速度更快。


C order vs Fortran order

  • C order 指的是行优先的顺序(Row-major Order),即内存中同行的元素存在一起,
  • Fortran Order则指的是列优先的顺序(Column-major Order),即内存中同列的元素存在一起。

Pascal, C,C++,Python都是行优先存储的,而Fortran,MatLab是列优先存储的。


Contiguous array

contiguous array指的是数组在内存中存放的地址也是连续的(注意内存地址实际是一维的)。

2维数组arr = np.arange(12).reshape(3,4)。数组结构如下

image

内存里中实际存储如下:

image

arrC order 的,在内存是行优先的。如果想要向下移动一列,则需要跳过3个块(例如,从0到4只需要跳过1,2和3)。

如果经过转置,arr.T没有了C连续特性,因为内存中元素的地址不变,同一行中的相邻元素在内存中不是连续的:

image

这时,arr.T变成了Fortran order,因为相邻列中的元素在内存中是相邻存储的。

从性能上来说,获取内存中相邻的地址比不相邻的地址速度要快很多(从RAM读取一个数值的时候可以连着一起读一块地址中的数值,并且可以保存在Cache中),这意味着对连续数组的操作会快很多。

由于arr是C连续的,因此对其进行行操作比进行列操作速度要快。通常来说

np.sum(arr, axis=1) # 按行求和

会比

np.sum(arr, axis=0) # 按列求和

稍微快些。
同理,在arr.T上,列操作比行操作会快些。


使用 np.ascontiguousarray()

  • Numpy中,随机初始化的数组默认都是C连续的。

  • 经过不规则的slice操作,则会改变连续性,可能会变成既不是C连续,也不是Fortran连续的。

  • 可以通过数组的.flags属性,查看一个数组是C连续还是Fortran连续的

>>> import numpy as np
>>> arr = np.arange(12).reshape(3, 4)
>>> arr.flags
    C_CONTIGUOUS : True
    F_CONTIGUOUS : False
    OWNDATA : False
    WRITEABLE : True
    ALIGNED : True
    WRITEBACKIFCOPY : False
    UPDATEIFCOPY : False

从输出可以看到数组arr是C连续的。
arr进行按列的slice操作,不改变每行的值,则还是C连续的:

>>> arr
array([[ 0,  1,  2,  3],
        [ 4,  5,  6,  7],
        [ 8,  9, 10, 11]])
>>> arr1 = arr[:2, :]
>>> arr1
array([[ 0,  1,  2,  3],
        [ 4,  5,  6,  7]])
>>> arr1.flags
    C_CONTIGUOUS : True
    F_CONTIGUOUS : False
    OWNDATA : False
    WRITEABLE : True
    ALIGNED : True
    WRITEBACKIFCOPY : False
    UPDATEIFCOPY : False

如果进行在行上的slice,则会改变连续性,成为既不C连续,也不Fortran连续的:


>>> arr1 = arr[:, 1:3]
>>> arr1.flags
    C_CONTIGUOUS : False
    F_CONTIGUOUS : False
    OWNDATA : False
    WRITEABLE : True
    ALIGNED : True
    WRITEBACKIFCOPY : False
    UPDATEIFCOPY : False

此时利用ascontiguousarray函数,可以将其变为连续的:


>>> arr2 = np.ascontiguousarray(arr1)
>>> arr2.flags
    C_CONTIGUOUS : True
    F_CONTIGUOUS : False
    OWNDATA : True
    WRITEABLE : True
    ALIGNED : True
    WRITEBACKIFCOPY : False
    UPDATEIFCOPY : False

参考

本篇文章由一文多发平台ArtiPub自动发布

相关文章

  • numpy中的np.ascontiguousarray()函数

    Numpy文档中的说明: "Return a contiguous array (ndim >= 1) in me...

  • python实现K近邻算法

    * 关于函数numpy.tile()的用法,可以参考:Numpy中tile()函数简单理解

  • Numpy札记4_通用函数

    Numpy中为我们提供了常见的数学函数,sin、cos、exp等,在numpy中这些函数对数组中的每个元素进行计算...

  • 一文详解numpy中np.nonzero()函数

    一文详解numpy中np.nonzero()函数Numpy中ndim、shape、dtype、astype的用法

  • Matrix01-04:numpy中的矩阵表示

    numpy中的matrix类 numpy提供了一个专门的矩阵处理模块:numpy.matlib。1、矩阵创建函数。...

  • Numpy中的数组叠加问题

    Numpy中的函数r_和c_ 问题: 如何使用numpy中的函数实现数组在水平方向和垂直方向的上的叠加? 答案: ...

  • 2019-06-14

    NumPy - 统计函数 NumPy 有很多有用的统计函数,用于从数组中给定的元素中查找最小,最大,百分标准差和方...

  • 2019-07-14

    NumPy - 字符串函数 以下函数用于对dtype为numpy.string_或numpy.unicode_的数...

  • numpy中的tile函数

    在学习数据挖掘时,遇到numpy.tile(A,B)函数,愣是没看懂怎么回事,装了numpy模块后,实验了几把,原...

  • Numpy中的mean函数

    numpy.mean( a, axis=None, dtype=None, out=None, keepdims=...

网友评论

      本文标题:numpy中的np.ascontiguousarray()函数

      本文链接:https://www.haomeiwen.com/subject/xmmcxktx.html