美文网首页
【泛30】拟南芥花瓣发育分子网络拓展与新的多分类转换策略

【泛30】拟南芥花瓣发育分子网络拓展与新的多分类转换策略

作者: 看远方的星 | 来源:发表于2021-04-04 21:29 被阅读0次

一、题名

拟南芥花瓣发育分子网络拓展与新的多分类转换策略(杨黎2017)

二、文章结构

摘要
Abstract
第一章 绪论
第二章 基于MADS-box诱饵与蛋白质相互作用的拟南芥花瓣发育分子网络拓展
第三章 一种新的多分类转二分类策略与特征选择方法
第四章 总结与展望
参考文献
致谢
作者简历

三、关键词及摘要解读

关键词:SVM;分类;蛋白质互作预测;多分类转二分类策略;PK策略;MIC-share
摘要
1、支持向量机(Support Vector Machine,SVM)以统计学习理论为基础,遵循结构风险最小原则,可有效解决非线性、维数灾难、过学习、局部极小等问题,具有良好的泛化推广能力。

2、蛋白互作在生物调控机理上发挥着至关重要的作用,且为典型、复杂的二分类问题,本文以基于MADS-box诱饵与蛋白质互作(Protein-protein interaction,PPI)的拟南芥花瓣发育分子网络拓展为对象例证了SVM在二分类问题上的应用。在实际应用中,多分类更普遍且更为复杂,本文提出了一种新的多分类转二分类策略和特征选择方法,较大幅度提升了独立预测精度。结果报道如下。

基于MADS-box诱饵与PPI的拟南芥花瓣发育分子网络拓展。阐明花器官发育调控机理具重要的进化、发育和生态学意义。

本文整合蛋白质互作、亚细胞定位、基因芯片、基因功能注释等数据库,基于SVM组建蛋白质互作可信预测模型,获得拟南芥花瓣蛋白质互作网络,以含有MADS-box结构域的蛋白为诱饵在网络中进行一级拓展,得到含38个蛋白质、67对互作的拓展网络。

基于拓展网络:
1)DAVID基因功能注释表明,多数蛋白质涉及的生物学过程与花发育调控相关。
2)提取到19个候选四元互作,涉及ABCDE模型基因之外的8个基因,其中含MADS-box结构域的AGL16可能是B类基因新成员或其冗余。
3)SEU、LUH、CHR4、CHR11、CHR17、AT3GO4960为拟南芥花瓣AP1-AP3PI-SEP四聚体的候选靶标基因。
本文结果为进一步深入解析拟南芥花瓣发育分子调控网络提供了参考。

3、新的多分类转二分类策略和特征选择方法。多分类较二分类在实际应用中更为普遍、预测难度更大,恰当的多分类转二分类策略与有效的特征选择方法是提高多分类问题预测精度的关键。

4、融合现有一对余(One-vs-All,OVA)、一对一(One-vs-One,OVO)、分层分类(Hierarchical Classification,HC)策略的优点,本文发展了一种两阶段的多分类转二分类新策略一PK,且其在特征选择阶段与决策阶段采用不同训练样本。

常用的最小冗余最大相关(Minimal Redundancy Maximal Relevance,mRMR)特征选择方法存在相关性测度与冗余性测度不可比、特征引入不可自动终止等缺陷,最大信息系数(Maximal Infornation Coefficient,MIC)可普适测度两个变量间的线性或非线性关联;

本文基于MIC与冗余分摊思想,发展了一种普适性的、可自动终止的特征选择新方法MIC-share。11个UCI多分类数据集的独立预测表明,MIC-share优于mRMR,PK策略优于一对余、一对一、HC策略,且在SVM上,较三种传统模型mRMR-OVA(67.61%)、mRMR-OVO(78.99%)、mRMR-HC(77.07%),MIC-share-PK模型加权平均精度提升至85.42%,MIC-share-PK模型在解决多分类问题上有广泛应用前景。
Time:21:10~21:28 18m

相关文章

网友评论

      本文标题:【泛30】拟南芥花瓣发育分子网络拓展与新的多分类转换策略

      本文链接:https://www.haomeiwen.com/subject/hrnckltx.html