美文网首页我爱编程
利用Python进行数据分析-读书笔记(2)

利用Python进行数据分析-读书笔记(2)

作者: ctripkai | 来源:发表于2018-04-12 15:07 被阅读0次

    4.2 通用函数:快速的元素级数组函数

    np.sqrt(arr) np.exp(arr)
    np.maximum(arr1,arr2) 计算数组arr1和arr2中元素级别最大的元素
    a,b = np.modf(arr) 返回浮点数数组的小数和整数部分 a为小数部分 b为整数部分
    通用函数有out参数,可以使得数组原地操作
    常见ufunc:

    abs  fabs(更快求绝对值)  sqrt  squre  exp  log  log10  log2  log1p  sign(元素正负号) 
    ceil(大于等于该值的最小整数)  floor(小于等于该值最大整数)
    rint(将各元素值四舍五入到最接近的整数,保留dtype)
    modf  isnan  isfinite  isinf  
    cos  cosh  sin  sinh  tan  tanh……
    logical_and  logical_not  logical_or
    add  substract(数组元素相减)  multiply divide/floor_divide(除法取整)
    pow(A,B)(A的B次方)  maximum  fmax(忽略Nan)  minimum  fmin
    mod  copysign(复制第二个数组中元素符号到第一个数组中)
    greater  greater_equal  less  less_equal  equal  not_equal (等价于>,>=,<,<=,==,!=)
    

    4.3 利用数组进行数据处理

    [X,Y] = np.meshgrid(x,y)
    若x.shape[0] = m y.shape[0] = n,均为一维数组
    则X.shape = Y.shape = (n,m) X每一行都是x的复制,Y的每一列都是y的复制
    np.where 等价于 x if condition else y
    x if condition else y 缺点:1.大数组处理不快 2.无法用于多维数组
    where(cond, arr1, arr2) cond值为true则选择arr1中元素,反之选择arr2中元素
    sum(where(data != 0, (data-estimate) **2, 0)) 计算两个矩阵差,残差平方求和
    np.where(arr>0, 2, -2) arr中正值替换为2负值替换为-2
    np.where(arr>0, 2, arr) arr中正值替换为2
    多位数组中的where应用 怎么理解numpy的where()?

    数学与统计方法

    arr.mean() arr.mean(axis = 1)/arr.mean(1)计算行平均值 arr,mean(axis = 0) 计算列平均值
    arr.sum() std 标准差 var 方差 min max argmin argmax最大值索引(默认是平铺的数组)
    cumsum 所有元素的累计和 cumprod 所有元素的累计积
    cumsum(axis=0) 从左到右计算每列累计和
    sum() 可以用于计算布尔型数组中true值个数
    any() 检查数组中是否存在true值
    all() 检查数组元素是否全部为true值
    arr.sort() 原地排序 arr.sort(1)/arr/sort(0) 按行/列排序
    ndarray.sort(axis=-1, kind='quicksort', order=None) 原地排序
    np.sort(a, axis=-1, kind='quicksort', order=None) 返回副本
    np.unique(arr) 找出数组中的唯一值并返回已排序的结果(针对一维数组)
    in1d(arr1,arr2) 返回arr1中的元素是否在arr2中的一个布尔型数组
    intersect1d(arr1,arr2) 返回交集有序结果 union1d(arr1,arr2) 返回并集有序结果
    setdiff1d(arr1,arr2) arr1 - arr2 差集
    setxor1d(arr1,arr2) 对称差集

    4.4 输入输出

    np.save(文件名,arr) 保存文件扩展名为.npy,自动加上
    np.load(文件名.npy)
    np.savez(文件名,a=arr1,b=arr2) 类似字典 文件扩展名npz 保存多个数组
    data = np.load(XXX) data['a'] data['b']
    np.savez_compressed(XXX,a = arr1,b = arr2) 类似savez,数据压缩很好的情况下使用

    4.5 线性代数

    arr1.dot(arr2) 矩阵乘法 等价于 np.dot(arr1,arr2)
    from numpy.linalg import XXX

    linalg中常用函数 转载图片

    4.6 伪随机数生成

    np.random.normal(size = (3,3)) 产生正态分布样本值
    np.random.seed(1234) 更改随机数种子
    np.random.RandomState(1234) 创建一个与其它隔离的随机数生成器


    转载图片
    转载图片

    4.7 随机漫步

    待续……

    相关文章

      网友评论

        本文标题:利用Python进行数据分析-读书笔记(2)

        本文链接:https://www.haomeiwen.com/subject/vwqxkftx.html