代谢组学定义
是研究代谢组在某一时刻细胞内所有代谢物的集合的一门学科,其研究对象大都是相对分子量1000以内的小分子物质。
基因组学和蛋白组学告诉你可能发生什么,而代谢组学则告诉你已经发生了什么。
代谢组学分类
非靶向代谢组、靶向代谢组/高通量靶标代谢组、广泛靶标代谢组/拟靶向代谢组
代谢组学技术平台
核磁共振NMR、气质联用GC-MS、液质联用LC-MS
临床代谢组学研究基本思路
代谢组学研究流程
组学信息挖掘-靶向检测验证-动物造模验证-干预实验验证
临床样本收集:
1.临床上,以组织和血液为主;最好选择无创和微创的体液样本。
2.样本量:参考知名杂志已发表的研究样本数量,病结合自身课题组已有的研究基础和经验;或实用PASS或者stata等统计软件等计算其所需的样本含量。
3.样本是否随机选择;用药、饮食情况和吸烟等;年龄、性别等在各组间无差异。样本分组符合公认标准。
组学数据分析
1.代谢组学数据到预处理
离群features和离群样本处理:离群值—四分位距法(IQR)和rsd法、离群样本--PCA
缺失值处理
数据归一化、标准化、中心化、LOESS和SVM(校正批次效应)
数据质控
2.代谢物初筛
差异倍数
T/U检验
对变量统计分析(O)PLS-DA,VIP值
3.锁定目标分子
机器学习:从庞大复杂的特征数据中高效筛选到简单组合的、可以代表整体数据特性的一组panel。方法: 逻辑回归(LR)、LASSO、随机森林(RF)、支持向量机(SVM)、Xgboost和神经网络等
4.ROC曲线
5.患病风险概率:建立的随机森林模型中,预测到的各数据集样本的患病风险。
网友评论