NumPy最重要的特点就是 ndarry
, 一种多维数组对象。
ndarry
是一个通用的同构数据多维容器,其中的所有数据必须是相同的类型。每个数组都有shape
(表示数组各维度大小的元组)和dtype
(表示数组数据类型)。
data.shape
data.dtype
创建ndarry
创建数组最简单的方法就是使array
函数,其接受一切序列对象包括嵌套序列,并会将其转换为一个多维数组。
除了array
外,zeros
和ones
分别可以创建指定长度或者形状的全0或全1数组。
>>> import numpy as np
>>> height=[1.73,1.68,1.71,1.89,1.79]
>>> np_height=np.array(height)
>>> weight=[65.4,59.2,63.6,88.4,68.7]
>>> np_weight=np.array(weight)
>>> np_height
array([1.73, 1.68, 1.71, 1.89, 1.79])
>>> np_weight
array([65.4, 59.2, 63.6, 88.4, 68.7])
>>> bmi=np_weight/np_height**2
>>> bmi
array([21.85171573, 20.97505669, 21.75028214, 24.7473475 , 21.44127836])
#array相加
>>> array1=np.array([1,2,3])
>>> array2=np.array([4,5,6])
>>> array1+array2
array([5, 7, 9])
#平均值和中值
>>> np.mean(np_height)
1.7600000000000002
>>> np.median(np_height)
1.73
#相关系数和标准差
>>> np.std(np_weight)
10.14487062509917
>>> np.corrcoef(np_weight,np_height)
array([[1. , 0.97514969],
[0.97514969, 1. ]])
#求和,排序
>>> np.sum(np_weight)
345.3
>>> np.sort(np_height)
array([1.68, 1.71, 1.73, 1.79, 1.89])
使用numpy随机抽样
抽样函数:np.random.normal(均值,标准差数量 均值,标准差数量 )
>>> height=np.round(np.random.normal(1.75,0.20,5000),2)
>>> weight=np.round(np.random.normal(60.32,15,5000),2)
>>> np_city=np.column_stack((height,weight))
>>> np_city
array([[ 1.73, 85.95],
[ 1.55, 48.23],
[ 1.69, 43.29],
...,
[ 1.95, 59.78],
[ 1.9 , 60.13],
[ 1.97, 73.86]])
网友评论