美文网首页解密大数据
第三次作业——正态分布

第三次作业——正态分布

作者: mudu86 | 来源:发表于2017-03-19 23:30 被阅读65次
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

%matplotlib inline
%config InlineBackend.figure_format = 'retina'

def normfun(x,mu,sigma):
    pdf = np.exp(-((x-mu)**2) / (2*sigma**2)) / (sigma * np.sqrt(2*np.pi))
    return pdf
iq_data = pd.read_csv('IQscore.csv')
iq = iq_data['IQ']
len(iq)
70
max(iq)
140
min(iq)
69
mean = iq.mean()
std = iq.std()
x = np.arange(60,150,1)
y = normfun(x,mean,std)
plt.plot(x,y)
plt.hist(iq, bins = 10, rwidth = 0.9, normed = True)
plt.title('IQ distribution')
plt.xlabel('IQ score')
plt.ylabel('Porbability')
plt.show()
output_5_0.png
std = iq.std()
std
15.015905990389498
mean
100.82857142857142

对数据的理解:

  • 该组数据平均值是100.83,标准差是15.02。
  • 大部分的数据集中在85至115之间。
  • 离平均值越远,数据越少,也可以理解为平均值与标准差之间的差值(mean-std)越大,数据越少。
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

%matplotlib inline
%config InlineBackend.figure_format = 'retina'
def normfun(x,mu,sigma):
    pdf = np.exp(-((x-mu)**2) / (2*sigma**2)) / (sigma * np.sqrt(2*np.pi))
    return pdf

data = pd.read_csv('stakes.csv')
time = data['time']
len(time)
89
min(time)
146.0
max(time)
153.19999999999999
mean = time.mean()
std = time.std()
x = np.arange(145,155,0.1)
y = normfun(x,mean,std)
plt.rcParams["font.family"] = "SimHei"
plt.plot(x,y)
plt.hist(time, bins = 10, rwidth = 0.9, normed = True)
plt.title('Time')
plt.xlabel(u'时间')
plt.ylabel(u'占比率')
plt.show()
output_14_0.png
mean
149.22101123595513
std
1.6278164717748154

对数据的理解:

  • 读取数据之后,通过len()函数得到整个数据的大小,对获取的数据有一个大概的认识。
  • 通过min()/man()函数得到该组数据的最大值和最小值,便于确认数据间距。
  • 通过可视化图形和得到的平均值、标准差,可以知道数据集中在147.59——150.85。
  • 离平均值越远,数据越少。

相关文章

  • 第三次作业——正态分布

    对数据的理解: 该组数据平均值是100.83,标准差是15.02。 大部分的数据集中在85至115之间。 离平均值...

  • 第三次作业-正态分布分析

    这次作业碰到了挺多的问题,部分问题已找到答案,以注释的形式出现在代码中。 比如python magic命令,在之前...

  • 正态分布作业一

    具体的代码及运行过程如下: 数据分析如下: 1)智商得分位于100~110区间内的人数最多,超过25%;2)智商得...

  • 正态分布作业二

    具体代码及过程如下: 数据分析: 1)将直方图分为10份后,其呈现出中间频次高,两边频次低的特点;2)但是与正态分...

  • 正态分布

    正态分布的概率密度: 如果μ=0且σ=1,则为标准正态分布: 每个正态分布都可以表示为标准正态分布: 正态分布函数...

  • 四、正态分布

    一、正态分布概率密度函数 二、不同均值和方差的正态分布 三、正态分布总结 四、python正态分布函数

  • 赵浚皓思维导图

    第三次作业

  • 第三次作业

    第三次作业

  • 5.归一化

    标准正态分布 标准正态分布(Standard Normal Distribution):标准正态分布式一个特殊的正...

  • 谈谈统计学正态分布阈值原理在数据分析工作中的运用

    一、背景 0.0 神说,要有正态分布,于是就有了正态分布。 0.1 神看正态分布是好的,就让随机误差都随了正态分布...

网友评论

    本文标题:第三次作业——正态分布

    本文链接:https://www.haomeiwen.com/subject/bjavnttx.html