NumPy的ndarray:一种多维数组对象
data=randn(2,3) #生成一个2行3列的数组
data
data*10
data+data
data.shape #数组的维度大小
data.dtype #数组的数据类型(所有元素必须是相同类型的)
创建ndarray
使用array函数,接受一切序列型的对象
data1 = [6, 7, 8, 9.5, 10]
arr1 = np.array(data1)
也可以接收嵌套序列,转换为多维数组
data2 = [[1, 2, 3, 4], [5, 6, 7, 8]]
arr2 = np.array(data2)
arr2.ndim 返回数组的维度(行数)
np.zeros(10) 获得10列全为0的数组
np.zeros((2,3)) 获得2行3列全为0的数组
np.zeros_like() 以另一个数组为参数,根据形状和dtype创建全为0的数组
np.ones() 的用法与ones类似
np.empty(2, 3, 4) 创建一个没有任何具体值的数组;这里是创建2个3行4列的新数组
np.arange(15) 输出array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14])
np.eye/identity(N) 创建一个正方的NxN单位矩阵
ndarray的数据类型
array()中接受dtype=xxx作为参数传入
np.array([1, 2, 3], dtype=np.float64)
可以通过astype方法显式的转换dtype,代码如下:
float_arr = arr.astype(np.float64) 相当于生产了一个新的数组,换了数据类型;不会改变arr的数据类型
如果某字符串数组表示的全是数组,也可以用astype将其转换为数值形式
array2 = np.array(['1.25', '3.7', '-9.4'], dtype=np.string_)
array2.astype(float) 注意np.float64也可以
array([1.25, 3.7, -9.4])
数组和标量之间的运算
对数据进行批量运算,这称作矢量化
大小相等的数组之间的任何算术运算可以将运算应用到元素级
大小不同的数组之间的运算叫做广播
基本的索引和切片
arr[N] 表示第N+1个元素,因为是0开始
arr[X:Y] 表示第X+1到第Y+1的切片(不包括Y+1)
arr[X:Y] = 2 相当于把切片的数据全部换成2, 会改变原arr的数据
使用arr[X:Y].copy()可以显式的进行复制操作
切片索引
布尔型索引
花式索引
数组转置和轴对换
arr.T
np.dot计算矩阵内积
np.dot(arr.T, arr)
理解arr.transpose()
参考源码 多谢大神的解释还有np.swapaxes()方法,接受一对轴编号
np.swapaxes(arr, X, Y) 或者arr.swapaxes(X, Y)
通用函数:快速的元素级组函数
利用数组进行数据处理
矢量化,用数组表达式代替循环的做法
将条件逻辑表述为数组运算
数学和统计方法
和\标准差等聚合运算
用于布尔型数组的方法
arr=randn(100)
(arr>0).sum()# Number of positive values
bools=np.array([False,False,True,False])
bools.any() 存在一个或多个
bools.all() 是否都是
排序
arr.sort
多维数组可以在任何一个轴向上进行排序,将轴编号传给sort即可
唯一化以及其他的集合逻辑
np.unique(arr)
np.in1d用于测试一个数组中的值在另一个数组中的成员的成员资格
values=np.array([6,0,0,3,2,5,6])
np.in1d(values,[2,3,6]) #注意这里是数字1
>>>array([ True, False, False, True, True, False, True], dtype=bool)
还有一些集合函数,参见表4-6
用于数组的文件输入输出
np.save()
np.load()
存取文本文件
np.loadtxt和np.genfromtxt
或者pandas的read_csv和read_table
线性代数
表4-7有常用的numpy.linalg函数
随机数生成
normal可以得到标准正太分布的样本数组
表4-8 部分numpy.random函数
网友评论