美文网首页python
METASOFT使用教程

METASOFT使用教程

作者: 又是一只小菜鸟 | 来源:发表于2019-06-28 14:42 被阅读21次

Meta回归分析的原理

Meta回归分析可评价研究间异质性的大小及来源。假如一项元分析纳入了20项研究,其中一些研究发现体育锻炼能改善抑郁症状,一些发现体育锻炼对抑郁情绪没有影响,还有一些研究发现体育锻炼会恶化抑郁。这些研究之间就存在异质性,研究结果的不一致可能是因为研究方案、研究的时间和地区、研究质量、体育锻炼的方式、被试的年龄和性别、抑郁的程度等。为了探究异质性的来源,需要进行Meta回归分析。

统计分析模型

根据统计模型的不同,可将Meta回归分析分为固定效应的Meta回归分析随机效应的Meta回归分析两大类。
基于固定效应模型的Meta回归分析假设多项研究具有一个共同的效应尺度,各项研究效应尺度存在的差异主要是因为随机误差造成;随机效应模型则假设各项研究不具有共同的效应尺度,而是每项研究都有自己的效应尺度,并将其定义为一随机变量,该变量呈正态分布。固定效应模型要求资料满足正态性、观察值间的独立性和研究间的方差齐性,如对不满足这三个条件的资料进行固定效应的分析, 就有扩大犯I类错误概率的风险;
随机效应模型则只要求资料满足正态性,其它两个条件则不作要求,故扩大了适用范围。在随机效应模型中,有最大似然法、矩法、限制性最大似然法、贝叶斯法等多种用于估计回归方程中的系数和研究间的变异。


本文重点测试下metasoft这个软件。
软件地址、manual:http://genetics.cs.ucla.edu/meta/
文章:Han, B. & Eskin, E. Random-effects model aimed at discovering associations in meta-analysis of genome-wide association studies.2011. Am. J. Hum. Genet. 88: 586–598.


提供四种模型:

Fixed Effects model (FE):就是上面提到的固定效应模型
Random Effects model (RE):随机效应模型
Han and Eskin's Random Effects model (RE2)
Binary Effects model (BE)

得到三类指标:

Summary effect size estimates(效应估计):提供beta值和标准误差SE;
Heterogeneity estimates(异质性估计):Cochran's Q 统计量 和它的p-value, I2
M-values:效应的后验概率
Small m-value (e.g. < 0.1):这项研究没有影响效应
Large m-value (e.g. > 0.9):这项研究有影响效应


输入文件格式:

行为snp
第一列是rsid;
第二列、第三列是研究1的beta值和se;
第四列、第五列是研究2的beta值和se;
以此类推。
缺失值写NA

给个例子如下:


code:

java -jar Metasoft.jar -input example.txt

结果文件:

给个例子如下,自己对照上面表格(只截取了前面几列):


log文件:

-参与分析的snp数量
-纳入分析的study数量
-\lambdameanbeta
-\lambdaheterogeneity


如何矫正人群结构

把snp单独放到一个文件
在命令行加入-lambda_mean or-lambda_hetero
查看log文件中的\lambdameanbeta,\lambdaheterogeneity
再运行代码,命令行加入-lambda_\lambdameanbeta
or -lambda_\lambdaheterogeneity

如何再单个study中矫正人群结构

在输入文件中,将每个研究的标准误差增加计算的通胀因子的平方根。


画森林图
code:

python pmplot.py [meta_input] [meta_output] [study_name] [study_order] [rsid] [gene_name] [out_file]
举例:

python pmplot.py data/input.txt data/output.txt study.name.txt study.order.txt rs32075748 Apoa2 Apoa2.pdf

看完大概流程是不是觉得还挺简单的?但是一想到制作输入文件是不还挺头疼的?哈哈哈~~~
所以,该软件还给出来转换格式的服务。要提前装好python和R。如下:

python plink2metasoft.py outputfile plink_assoc_file1 plink_assoc_file2 plink_assoc_file3 ...

输出三个结果文件:
.meta file:改好格式的文件;
.mmap file:有SNP map的信息;
.log file:过滤掉的snp信息以及过滤掉的原因。


meta分析结果解读

M-value作为衡量异质性指标
Small m-value (e.g. < 0.1): The study is predicted to not have an effect.
Large m-value (e.g. > 0.9): The study is predicted to have an effect.
Otherwise: It is ambiguous to make a prediction.
根据M-value和它的p值,可以画图P-M plot:


好啦,今天就到这啦,我也是头一次看,大家互相交流吧!加油!

相关文章

网友评论

    本文标题:METASOFT使用教程

    本文链接:https://www.haomeiwen.com/subject/hdgjcctx.html