美文网首页我爱编程
利用Python进行数据分析-读书笔记(2)

利用Python进行数据分析-读书笔记(2)

作者: ctripkai | 来源:发表于2018-04-12 15:07 被阅读0次

4.2 通用函数:快速的元素级数组函数

np.sqrt(arr) np.exp(arr)
np.maximum(arr1,arr2) 计算数组arr1和arr2中元素级别最大的元素
a,b = np.modf(arr) 返回浮点数数组的小数和整数部分 a为小数部分 b为整数部分
通用函数有out参数,可以使得数组原地操作
常见ufunc:

abs  fabs(更快求绝对值)  sqrt  squre  exp  log  log10  log2  log1p  sign(元素正负号) 
ceil(大于等于该值的最小整数)  floor(小于等于该值最大整数)
rint(将各元素值四舍五入到最接近的整数,保留dtype)
modf  isnan  isfinite  isinf  
cos  cosh  sin  sinh  tan  tanh……
logical_and  logical_not  logical_or
add  substract(数组元素相减)  multiply divide/floor_divide(除法取整)
pow(A,B)(A的B次方)  maximum  fmax(忽略Nan)  minimum  fmin
mod  copysign(复制第二个数组中元素符号到第一个数组中)
greater  greater_equal  less  less_equal  equal  not_equal (等价于>,>=,<,<=,==,!=)

4.3 利用数组进行数据处理

[X,Y] = np.meshgrid(x,y)
若x.shape[0] = m y.shape[0] = n,均为一维数组
则X.shape = Y.shape = (n,m) X每一行都是x的复制,Y的每一列都是y的复制
np.where 等价于 x if condition else y
x if condition else y 缺点:1.大数组处理不快 2.无法用于多维数组
where(cond, arr1, arr2) cond值为true则选择arr1中元素,反之选择arr2中元素
sum(where(data != 0, (data-estimate) **2, 0)) 计算两个矩阵差,残差平方求和
np.where(arr>0, 2, -2) arr中正值替换为2负值替换为-2
np.where(arr>0, 2, arr) arr中正值替换为2
多位数组中的where应用 怎么理解numpy的where()?

数学与统计方法

arr.mean() arr.mean(axis = 1)/arr.mean(1)计算行平均值 arr,mean(axis = 0) 计算列平均值
arr.sum() std 标准差 var 方差 min max argmin argmax最大值索引(默认是平铺的数组)
cumsum 所有元素的累计和 cumprod 所有元素的累计积
cumsum(axis=0) 从左到右计算每列累计和
sum() 可以用于计算布尔型数组中true值个数
any() 检查数组中是否存在true值
all() 检查数组元素是否全部为true值
arr.sort() 原地排序 arr.sort(1)/arr/sort(0) 按行/列排序
ndarray.sort(axis=-1, kind='quicksort', order=None) 原地排序
np.sort(a, axis=-1, kind='quicksort', order=None) 返回副本
np.unique(arr) 找出数组中的唯一值并返回已排序的结果(针对一维数组)
in1d(arr1,arr2) 返回arr1中的元素是否在arr2中的一个布尔型数组
intersect1d(arr1,arr2) 返回交集有序结果 union1d(arr1,arr2) 返回并集有序结果
setdiff1d(arr1,arr2) arr1 - arr2 差集
setxor1d(arr1,arr2) 对称差集

4.4 输入输出

np.save(文件名,arr) 保存文件扩展名为.npy,自动加上
np.load(文件名.npy)
np.savez(文件名,a=arr1,b=arr2) 类似字典 文件扩展名npz 保存多个数组
data = np.load(XXX) data['a'] data['b']
np.savez_compressed(XXX,a = arr1,b = arr2) 类似savez,数据压缩很好的情况下使用

4.5 线性代数

arr1.dot(arr2) 矩阵乘法 等价于 np.dot(arr1,arr2)
from numpy.linalg import XXX

linalg中常用函数 转载图片

4.6 伪随机数生成

np.random.normal(size = (3,3)) 产生正态分布样本值
np.random.seed(1234) 更改随机数种子
np.random.RandomState(1234) 创建一个与其它隔离的随机数生成器


转载图片
转载图片

4.7 随机漫步

待续……

相关文章

网友评论

    本文标题:利用Python进行数据分析-读书笔记(2)

    本文链接:https://www.haomeiwen.com/subject/vwqxkftx.html