美文网首页深度学习
numpy模块中axis

numpy模块中axis

作者: baixiaoshuai | 来源:发表于2018-09-07 14:19 被阅读0次

    参考文章

    以下是文章正文

    axis的作用

    numpy是python进行科学计算必不可少的模块,随着深度学习越来越火,numpy也越来越流行。了解numpy的人知道,在numpy中,有很多的函数都涉及到axis,很多函数根据axis的取值不同,得到的结果也完全不同。可以说,axis让numpy的多维数组变的更加灵活,但也让numpy变得越发难以理解。这里通过详细的例子来学习下,axis到底是什么,它在numpy中的作用到底如何。

    首先,在numpy中维度被称作轴数(In NumPy dimensions are called axes。axes是axis的复数形式。),如4维数组就表示有4个轴,轴的编号从0开始,所以4个轴分别对应的编号就是0,1,2,3。四个轴也对应数组的四个下标索引,a[index0][index1][index2][index3]。

    为什么会有axis这个东西,原因很简单:numpy是针对矩阵或者多为数组进行运算的,而在多维数组中,对数据的操作有太多的可能,我们先来看一个例子。比如我们有一个二维数组:

    >>> import numpy as np
    >>> data = np.array([
    ... [1,2,1],
    ... [0,3,1],
    ... [2,1,4],
    ... [1,3,1]])
    

    这个数组代表了样本数据的特征,其中每一行代表一个样本的三个特征,每一列是不同样本的特征。如果在分析样本的过程中需要对每个样本的三个特征求和,该如何处理?简单:

    >>> np.sum(data, axis=1)
    array([4, 4, 7, 5])
    

    那如果想求每种特征的最小值,该如何处理?也简单:

    >>> np.min(data, axis=0)
    array([0, 1, 1])
    

    又如果想得知所有样本所有特征的平均值呢?还是很简单:

    >>> np.average(data)
    1.6666666666666667
    

    由此可以看出,通过不同的axis,numpy会沿着不同的方向进行操作,如果不设置,那么对所有的元素操作。如果axis=0,则沿着纵轴进行操作;axis=1,则沿着横轴进行操作。但这只是简单的二位数组,如果是多维的呢?可以总结为一句话:设axis=i,则numpy沿着第i个下标变化的方向进行操作。例如一个二维数组:data =[[a00, a01],[a10,a11]],所以axis=0时,沿着第0个下标变化的方向进行操作,也就是a00->a10, a01->a11,也就是纵坐标的方向,axis=1时也类似。首先看上述中np.min(data, axis=0)的计算过程。axis=0表示0轴变化,data的shape是(4,3),也就是说0轴的变化值从0->1->2->3,而1轴的取值有0,1,2。现在要求min值,首先要进行分组,分组的标准就是所有分组内的索引只有0轴不同,其他轴的值都相同,因此上述数据分组为:

    a00,a10,a20,a30;#只有0轴变化,1轴始终为0
    a01,a11,a21,a31;#只有0轴变化,1轴始终为1
    a02,a12,a22,a32;只有0轴变化,1轴始终为2
    

    在对上述分组分别求min,即可得结果。
    下面我们举一个四维的求sum的例子来验证一下:

    >>> data = np.random.randint(0, 5, [4,3,2,3])
    >>> data
    array([[[[4, 1, 0],
             [4, 3, 0]],
            [[1, 2, 4],
             [2, 2, 3]],
            [[4, 3, 3],
             [4, 2, 3]]],
    
           [[[4, 0, 1],
             [1, 1, 1]],
            [[0, 1, 0],
             [0, 4, 1]],
            [[1, 3, 0],
             [0, 3, 0]]],
    
           [[[3, 3, 4],
             [0, 1, 0]],
            [[1, 2, 3],
             [4, 0, 4]],
            [[1, 4, 1],
             [1, 3, 2]]],
    
           [[[0, 1, 1],
             [2, 4, 3]],
            [[4, 1, 4],
             [1, 4, 1]],
            [[0, 1, 0],
             [2, 4, 3]]]])
    

    当axis=0时,numpy沿着第0维的方向来求和,也就是第一个元素值=a0000+a1000+a2000+a3000=11,第二个元素=a0001+a1001+a2001+a3001=5,同理可得最后的结果如下:

    >>> data.sum(axis=0)
    array([[[11,  5,  6],
            [ 7,  9,  4]],
    
           [[ 6,  6, 11],
            [ 7, 10,  9]],
    
           [[ 6, 11,  4],
            [ 7, 12,  8]]])
    

    当axis=3时,numpy验证第3维的方向来求和,也就是第一个元素值=a0000+a0001+a0002=5,第二个元素=a0010+a0011+a0012=7,同理可得最后的结果如下:

    >>> data.sum(axis=3)
    array([[[ 5,  7],
            [ 7,  7],
            [10,  9]],
    
           [[ 5,  3],
            [ 1,  5],
            [ 4,  3]],
    
           [[10,  1],
            [ 6,  8],
            [ 6,  6]],
    
           [[ 2,  9],
            [ 9,  6],
            [ 1,  9]]])
    

    小结

    所以,综上可以得出一般结论,如numpy数组的shape是(n_1,n_2,...,n_n),沿x轴,0<=x<=n-1,即将n_1,n_2,n_{x-1},,n_{x+1},..,n_n进行全排列,然后将n_x轴分别用n_x的范围替代即可,而计算出的值在新数组中的位置即(n_1,n_2,n_{x-1},n_{x+1},..,n_n)。如numpy数组的shape是(2,3,2),沿axis=1进行求和,那便对axis=0和axis=2的组合进行排列,得到:

    0_0,对中间的下划线进行分别用1轴的取值(0,1,2)填充,分别得到000,010,020,这就是一个求和分组
    0_1,同理得到001,011,021
    1_0,同理得到100,110,120
    1_1,同理得到101,111,121
    

    然后得到的求和结果就是:
    [
    [000+010+020,001+011+021],
    [100+110+120,101+111+121]
    ]

    注意:上述中000,001,...都是数组中元素的下标索引。

    实例:

    >>> data = np.random.randint(0, 5, [2,3,2])
    >>> data
    array([[[1, 0],
            [2, 0],
            [0, 1]],
    
           [[3, 1],
            [0, 1],
            [2, 4]]])
    >>> np.sum(data,axis=1)
    array([[3, 1],
           [5, 6]])
    >>> data[0,0,0]+data[0,1,0]+data[0,2,0]
    3
    >>> data[0,0,1]+data[0,1,1]+data[0,2,1]
    1
    >>> data[1,0,0]+data[1,1,0]+data[1,2,0]
    5
    >>> data[1,0,1]+data[1,1,1]+data[1,2,1]
    6
    >>>
    

    相关文章

      网友评论

        本文标题:numpy模块中axis

        本文链接:https://www.haomeiwen.com/subject/umnqgftx.html