美文网首页程序员我爱编程
利用Python进行数据分析 - 第四章 numpy基础:数组和

利用Python进行数据分析 - 第四章 numpy基础:数组和

作者: rabbitq0082 | 来源:发表于2017-03-13 17:29 被阅读68次

    标签: 读书笔记 python 数据分析


    1. 创建ndarray(多维数组对象)

    函数 说明
    array 将参数数据(列表,元祖,数组等序列类型)转换为ndarray,可指定dtype
    arange 类似range,但返回的是一个ndarray而不是列表
    ones 根据指定的形状和dtype创建一个全1数组
    ones_like 以另一个数组为参数,根据其形状和dtype创建一个全1数组
    zeors,zeros_like 全0数组
    empty,empty_like 创建新数组,只分配内存空间但不填充任何值
    eye,identity 创建一个正方的N*N单位矩阵(对角线为1,其余为0)
    astype(type) 数组转换为dtype为type的数组
    In: import numpy as np
    #array
    In: np.array([[1,2,3],[4,5,6]])
    Out: 
    array([[1,2,3],
           [4,5,6]])
    In: np.array([1,2,3],dtype=np.int32)
    Out: array([1,2,3])
    #arange
    In: np.arange(3)
    Out: array([0,1,2])
    #ones
    In: np.ones((2,3))
    Out:
    array([[1,1,1],
           [1,1,1]])
    

    2. 数组和标量之间的运算

    • 大小相等的数组之间的算数运算会将运算应用的元素级,各个相同位置的元素进行各自运算
    • 数组与标量的算术运算会将标量值传播到各个元素进行运算

    3. 基本的索引和切片

    • 按索引访问元素
    In: arr = arange(10)
    In: arr
    Out: array([0,1,2,3,4,5,6,7,8,9])
    In: arr[5]
    Out: 5
    In: arr[5:8]
    Out: array([5,6,7])
    #将一个标量值赋值给一个切片时,该值会自动传播(广播)到整个选区
    In: arr[5:8] = 12
    In: arr
    Out: array([0,1,2,3,4,12,12,12,8,9])
    In: arr2d = np.array([[1,2,3],[4,5,6],[7,8,9]])
    In: arr2d[2,2]
    Out: 9
    In: arr2d[2]
    Out: array([7,8,9])
    
    • 与python普通列表切片的区别:普通列表的切片是列表切片部分的复制;数组切片是原始数组部分的引用(考虑到大数据量数组的性能问题),即切片上的任何修改都会直接反映到源数组上。
    In: arr1 = arr[5:8]
    In: arr1
    Out: array([0,1,2,3,4,12,12,12,8,9])
    In: arr1[1] = 12345
    In: arr
    Out: array([0,1,2,3,4,12,12345,12,8,9])
    
    • 如果需要数组切片的副本而非引用,需要显示进行复制操作 arr2 = arr[5:8].copy()
    • 多维数组切片
    In: arr2d = np.array([[1,2,3],[4,5,6],[7,8,9]])
    #从第一个轴切片
    In: arr2d[:2]
    Out: 
    array([[1,2,3],
           [4,5,6]])
    #一次从多个轴切片
    In: arr2d[1:2,1:]
    Out:
    array([[5,6]])
    #某一个轴直接用索引,得到的结果数组的维度将降低一维
    In: arr2d[1,:2]
    Out:
    arrary([4,5])
    #只有冒号,表示选取整个轴
    In: arr2d[:,:1]
    Out:
    array([[1],
           [4],
           [7]])
    #对切片的赋值会传播到整个切片区域
    In: arr2d[:2,1:] = 0
    In: arr2d
    Out:
    array([[1,0,0],
           [4,0,0],
           [7,8,9]])
    
    • 通用函数

    待续...

    相关文章

      网友评论

        本文标题:利用Python进行数据分析 - 第四章 numpy基础:数组和

        本文链接:https://www.haomeiwen.com/subject/zzqqnttx.html