能接受Normal的人设,真的需要很大的勇气;
- 然后统计学告诉你,大家都一样,同一个分布出来的个体,差异只是抽样误差而已;真的么?要证明一下吗?
- 大可不必,你也有风景,只是在别处
正态分布|高斯分布
高斯这个名字要记住,以后可以装逼用(高斯真的唬了我两年啊)
标准差也不要说标准差,我们就说σ(sigma)
智商群落里独树一帜的莫扎特和爱因斯坦老爷子正态分布特征
- 中间高、两边低、左右对称,曲线呈钟形
- 关于x=μ对称
- σ决定曲线的形状
- X~N(μ,σ2),则Z=(X- μ)/ σ ~N(0,1)
那些年我们用过却不记得的正态分布
rnorm是产生随机数的一种方法
- 第一个参数是问你,需要几个随机数,这里我设定成了5
- mean和sd分别是对正态分布的均值和标准差(sigma)的设定,跟R讲明你需要什么样的正态分布
> set.seed(1)
> rnorm(5, mean = 0, sd = 1)
[1] -0.6264538 0.1836433 -0.8356286 1.5952808 0.3295078
scale是我们画热图常用的对数据处理的一个函数
- center是指每列的元素减去该列的均值
- scale是指在center功能执行后,每列元素除以其标准差
- 所以,最后展示在热图里的数据就是,该元素与其均值究竟差了几个标准差
scale(x, center = TRUE, scale = TRUE)
> x <- matrix(1:10, ncol = 2)
> y<- scale(x)
> y
[,1] [,2]
[1,] -1.2649111 -1.2649111
[2,] -0.6324555 -0.6324555
[3,] 0.0000000 0.0000000
[4,] 0.6324555 0.6324555
[5,] 1.2649111 1.2649111
attr(,"scaled:center")
[1] 3 8
attr(,"scaled:scale")
[1] 1.581139 1.581139
以上内容有什么写得不对的,烦请指正,在此谢过。
参考资料:
https://www.zhihu.com/question/26854682
课程分享
生信技能树全球公益巡讲
(https://mp.weixin.qq.com/s/E9ykuIbc-2Ja9HOY0bn_6g)
B站公益74小时生信工程师教学视频合辑
(https://mp.weixin.qq.com/s/IyFK7l_WBAiUgqQi8O7Hxw)
招学徒:
(https://mp.weixin.qq.com/s/KgbilzXnFjbKKunuw7NVfw)
网友评论