今天师兄给我讲了模拟实验,分享给大家
构建网络时,有两种方法,相关性和互信息,那么这两种方法孰优孰劣呢?
已知相关性是线性的,互信息非线性的,那么我们构建模拟实验时,要综合考虑这两种数据类型。并且,互信息只能应用于整数,正态分布四舍五入后容易聚集到一起,影响效果,所以我们选择均匀分布。
1. 生成从100个0:1000的均匀分布数据,并取整数
x1<-runif(100,0,1000)
x1<-round(x1,digits = 0)
2. 生成线性和非线性方程
a=3
b=3
y1<-a*x1
y2<-b*x1^2
3. 给方程加残差扰动
k<-1000
m<-runif(100,0,k)
y1<-y1+m
y2<-y2+m
4.分别求相关性和互信息
cor(x1,round(y1))
cor(x1,round(y2))
mutinformation(x1,round(y1))
mutinformation(x1,round(y2))
网友评论