美文网首页
非靶向代谢组学如何用Excel完成“80%规则”过滤

非靶向代谢组学如何用Excel完成“80%规则”过滤

作者: Seurat_Satija | 来源:发表于2021-09-29 15:57 被阅读0次

在LC-MS的非靶向代谢组学中,原始数据经过数据预处理后生成供下一步统计分析的数据集(包括样品编号,保留时间_质核比,以及峰强度)。在所生成的列表中通常包含有大量的缺失值(零值),常用来处理缺失值的方法有:1. 赋予一个值;2. 去掉缺失值过多的变量。


目前较为常用的方法是,采用“80%规则”来去掉缺失值过多的变量。“80%规则”的来源可以参看文献 Bijlsma S, Bobeldijk I, Verheij E R, et al. Large-scale human metabolomics studies: a strategy for data (pre-) processing and validation. Analytical chemistry, 2006, 78(2): 567-574.


原文中对“80%规则”的定义: If a variable had a nonzero measurement value in at least 80% of the variables within one of the two subsets, the variable was included in the data set; otherwise the variable was removed. This procedure will be referred to as the 80% rule”.

“80%规则”是指去除在所有组别中(如模型组和正常组)中出现频率(非零值)都小于80%的离子。


举个简单的离子,如下图:

图片

由于多数仪器配套的数据预处理软件并未包含与此类似的功能,所以这一步操作往往需要通过第三方软件完成。了解到,这个操作如果用R语言来完成的话,非常简单,但是由于还未接触过R,所以通常的处理都用Excel来完成。


介绍以下如何用Excel来完成“80%规则”过滤。(高手请止步 o(∩_∩)o)

1. 用countif功能计算每一行的零值个数。

图片 图片

2. 计算零值个数百分比。

图片

3. 利用格式筛选功能,去除在两组中,百分比均大于20%的变量。搞定!

图片

原创文章,欢迎转载。

不足之处,还请指正。_
如何用Excel完成“80%规则”过滤 (qq.com)

相关文章

网友评论

      本文标题:非靶向代谢组学如何用Excel完成“80%规则”过滤

      本文链接:https://www.haomeiwen.com/subject/rsujnltx.html