41 - 多种数据分布

作者: Hello育种 | 来源:发表于2022-03-21 03:29 被阅读0次

41 - 多种数据分布
【区块链入门】1.2—区块链的特性和核心价值是什么？
Redis持久化知识点—RDB+AOF
centos7下安装janusGraph单机版
干货分享：SpringBoot基于数据库实现简单的分布式锁
spring boot redis分布式锁
MySql高可用学习（一）：linux下mysql主从配置
SpringBoot基于数据库实现简单的分布式锁
简析数栈高效数据同步插件FlinkX
分布式存储系统的哈希算法研究

例子1 平均值

MCMC结果与概率学家得到的结果一致。因为 u的先验值是没有信息的。P(u) = 1, 所以和概率学家将其当做固定效应的结果一致。

image.png

例子2 sir效应

我们知道仔猪的生长率，求来自不同父亲的不同。
首选我虚们需要知道方差（BLUP发）：

image.png

如果使用MCMC（gibbs 抽样）：我们具有y并且假设所有需要估计的变量为random变量。 Gibbs对每个变量抽样时，是假设其他所有的变量已知的情况下进行。所以需要给他们初始值。
后验分布是

image.png

每次你抽样的参数从后验分布中，次数多了，可以计算每个参数的平均值作为需求参数的估计值。

收敛和自动相关

要去除刚开始的一部分数据（burn -n），因为你的初始值可能不同
因为每次抽样基于上一次的结果，所以两次之间会自动有相关，所以需要抽样很多次，并且间隔抽取使用。
另一个解决方法：是运行多条链进行。

例子3 mixtures

假设我们称重仔猪的体重，有的在第一天，有的在第二天，但是我们忘记的具体标记，那我们怎么查看不同天称重，是否显著不同呢？

image.png

图示，体重是符合正太分布，其他参数不beta分布：

image.png

写成所有参数的后验分布：

image.png

后验分布为：

image.png

抽样每个动物，抽样在

image.png

条件下；抽样π在t的条件下。
和EM算法类似

总结

对于每个变量，需要在其他变量已知的后验条件和和表型的条件下进行。
对于确切的变量，给出分布，会更容易进行
抽取很多样本和进行多条链，有利于结果的可靠性
根据后验的结果，可以计算需要参数的平均值和SE

问题

对于后验分布的选择，可以自己选择，但是越复杂的分布，越难完成。正太分布是最常用的。
如果没有足够信息对某个效应，可能将其当做随机效应。
得到方差为负值，这有可能说明你的模型有错误（y）；也可能因为方差非常小

网友评论

Animal Genetics

本文标题：41 - 多种数据分布

本文链接：https://www.haomeiwen.com/subject/nczrhrtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

41 - 多种数据分布

例子1 平均值

例子2 sir效应

收敛和自动相关

例子3 mixtures

总结

问题

相关文章