前言
目前, 基因组选择进入了一个高速发展的阶段, 各种新的算法和模型被提出, 这里对基因组选择的软件进行一个汇总
大纲
- 1, 调查背景及目的
- 2, 调查方法介绍
- 3, 主要软件汇总
- 4, 基因组软件介绍:单机版
- 5, 基因组软件介绍: R语言版
- 6, 结论及建议
1. 调查背景及目的
全基因组选择需要选择合适的分析软件,本次调查为了解相关软件应用的整体情况,为选择合适的软件提供决策。
本次软件调查基于BLUP的方法,贝叶斯方法由于速度的限制,不做考虑。基于BLUP的方法,在速度、准确性和无偏性测试中比较稳健,因此选择基于BLUP的软件。
2. 调查分析方法介绍
选择软件主要来源于以下三个方面:
- 文献检索
- 通过客户和朋友了解
- 实际的软件使用经验
3. 主要软件汇总
单机版软件
R语言软件包
image4. 基因组软件介绍: 单机版
4.1 DMU软件
网址:http://dmu.agrsci.dk
创建人:Just Jensen, Per madsen
计算机语言:FORTRAN
DMU命名:
- D(derivative free):免求导
- MU(multivariate):多性状
免费软件,商业使用需要授权
image模块:
-
DMU1 : Prepare program,数据预处理和起始分析程序
-
DMUAI: 约束性最大似然估计方差组分(AI,EM,AI-EM)
-
DMU4: 计算BLUE值和BLUP值
-
DMU5:迭代求解,预条件共轭梯度法
-
RJMC:贝叶斯估算方差,Gibbs抽样
4.2 ASREML软件
网址:https://www.vsni.co.uk/software/asreml/
创建人:Arthur Gilmour
计算机语言:FORTRAN
ASREML命名:
- A:AI平均信息算法
- S:稀疏矩阵
- REML:约束性最大似然法
商业软件:收费
image作为商业软件,其优点主要体现在:
- 1,操作简单
- 2,运算速度快
- 3,可以支持复杂模型
- 4,有技术支持
4.3 PIBLUP软件
网址:https://github.com/huiminkang/PIBLUP
创建人:康慧敏 刘剑锋
计算机语言:C
PIBLUP命名:
- P:预条件共轭梯度(PCG)
- I:迭代数据(IOD)
- BLUP:最佳线性无偏预测
免费软件,商业使用需要授权
image4.4 BLUPF90软件
网址:http://nce.ads.uga.edu/wiki/doku.php
创建人:Ignacy Misztal , Shogo Tsurute,
Daniela Lourenco, Yutake Masuda, Ignacio Aguilar
计算机语言:FORTRAN
BLUPF90命名:
- BLUP:最佳线性无偏预测
- F90:Fortran 90/95
免费软件,商业使用需要授权
imageBLUPF90模块介绍:
-
RENUM90: 处理数据和代码,生成模板
-
BLUPF90:计算BLUP值
-
AIREMLF90:使用AI,估算方差组分,计算BLUP值
4.5 WBOMBAT软件
网址:http://didgeridoo.une.edu.au/km/wombat.php
创建人:Karin Meyer
计算机语言:FORTRAN
免费软件,商业使用需要授权
image4.6 MixBLUP软件
创建人:Wageningen, Animal Breeding and Genomics
商业软件:收费
价格表:
image
4.7 PEST, VCE和DFREML软件
- PEST主要用于混合线性模型求解
- VCE主要用于估算方差组分
WOMBAT replaces DFREML which has been withdrawn from distribution at the end of 2005.
DFREML软件, 是早期的非求导REML程序,现在演变为了WOMBAT
4.8 GVCBLUP软件
网址: https://animalgene.umn.edu/gvcblub
估算GBLUP育种值,可以计算加性效应和显性效应。
image image4.9 solGS软件
网址: https://github.com/solgenomics
构建的基于Web的GS平台
image image5. 基因组软件介绍: R语言版
5.1 rrBLUP
rrBLUP
可以估算rrBLUP值,估算每个SNP的效应值。
image5.2 sommer
Sommer
可以估算方差组分
可以计算GBLUP值
5.3 synbreed
Synbreed
可以估算方差组分
可以计算GBLUP值
可以交叉验证
5.4 cpgen
cpgen
多线程
rrBLUP内核
5.5 BGGE
基因与环境互作
image5.6 BGLR
里面有GBLUP的计算内核, 但主要是用于贝叶斯的计算
image5.7 GSMX
GSMX
多性状全基因组选择
估算方差组分
交叉验证
5.8 PopVar
PopVar
全基因组选择
估算方差组分
交叉验证
5.9 xbreed
基因组与系谱数据模拟软件包
image5.10 hiblup
地址: https://github.com/hiblup/hiblup
功能描述:
image
6. 结论及建议
目前市面上用于基因组选择的软件, 大体是以上这么多, 总体而言, 传统评估软件, 比如ASREML, DMU, BLUPF90都是基于Fortran编写的, 在常规分析中应用较广, 支持的模型和矩阵结构丰富. 随着基因组时代的到来, 特别是一步法的应用, 其本质将系谱构建的A逆矩阵, 替换为系谱和基因组构建的H逆矩阵,因此这些软件在基因组选择时代也可以广泛应用.
难点在于数据量的增大, G矩阵的求逆以及方差组分估算都是一个挑战, 目前不断有新的算法和模型出现, 但具体到应用还要一些时间的检验.
建议学习软件时, 以理论学习为主, 比如H矩阵构建, 方差组分估算等, 数量遗传学扎实了, 再去学习相关软件, 都是想通的.
整体而言, BLUPF90构建H矩阵相对简单, ASREML遇到错误时报错机制比较健全, DMU5和PIBLUP计算BLUP值速度很快.
7. 作者介绍
image我是邓飞, 是一个读了玉米育种的研究生, 做了一个二代重测序的课题, 毕业之后进入了一家卖软件的公司, 开始了统计分析的培训, 现在做起了动物全基因组选择的数据分析工作.
擅长的学科:
-
作物育种
-
动物育种
-
生物统计
-
数量遗传学
擅长的软件:
-
统计软件: SAS, SPSS, GenStat, R
-
脚本语言: Perl, Python, Shell
-
遗传评估软件: ASREML, DMU, BLUPF90, WOMBAT
-
最常使用的软件: Perl, Python, R
-
想要学习的软件: Go, Django
喜欢做的事情:
-
放飞自我
-
写段子
-
吐槽
-
写读书笔记
-
写教程cookbook
-
打排球
-
滑滑板
-
羽毛球
网友评论