美文网首页
基于代谢物和代谢物反应的Gephi网络分析过程

基于代谢物和代谢物反应的Gephi网络分析过程

作者: 快乐的夏天_eaf9 | 来源:发表于2019-01-16 09:58 被阅读0次

1.excel中代谢物简化

【注意】以下过程为vba编程

1.1 excel格式模板

Sheet 1截图
sheet2 截图
【特别说明】为了保证替换过程没有错误,因此对metabolite的名称首先利用len函数进行统计,然后从长到短进行排序。可以尽可能地减少失误;

1.2 vba代码

% With Worksheets(1)
% a = Worksheets(2).Cells(Worksheets(2).Rows.Count, 1).End(xlUp).Row '统计sheet2最后一个空格的位置
% For i = 2 To a Step 1
% .Range("D:D").Replace what:=Worksheets(2).Cells(i, 3), Replacement:=Worksheets(2).Cells(i, 2), LookAt:=xlPart, SearchOrder:=xlByRows, MatchCase:=True
% Next
% End With

替换结束后,手动将反应简写列和反应式列粘贴至Sheet3

手动粘贴Sheet3截图
【根据自己情况调整】我们只研究前502个实际的反应
根据具体的情况,我们编写了data2source函数,用于反应式向source→direction连接关系的转换;
tic
[~,data,~]=xlsread('Model1.xls','Sheet3');
result=cell(1,3);
result{1,1}='源';
result{1,2}='目标';
result{1,3}='label';

for i =1:length(data)
    if contains(data{i,2},'->')
        reaction_type='->';
    else
        reaction_type='<->';
    end
    reaction=data{i,2};
    reaction_tag=data{i,1};
    result_data=data2source(reaction,reaction_tag,reaction_type);
    result=cat(1,result,result_data);
end
xlswrite('data2source.xlsx',result);
msgbox('已经结束!')
toc

2. 化合物source→direction去重复

具体代码:

[~,data,~]=xlsread('data2source.xlsx','Sheet1');
for i=length(data):-1:3
    for ii= (i-1):-1:2
        if isequal(data{i,1},data{ii,1}) & isequal(data{i,2},data{ii,2})
            data(ii,:)=[];  % 特别声明,在删除cell的某行或某列的时候,使用的符号为();
        end
    end
end
xlswrite('Source2Direction.xlsx',data);

3. excel去重

%运用以下vba代码,进行重复行的去除


去除多余行的vba代码

4. gephi数据输入

在gephi输入csv的时候,边数据没法输入。具体的解决方法为:
csv的编码为ANSI,然后将输入的时候将编码格式改为GB2312
【可以参考的博客】https://www.toutiao.com/i6634028049379639822/
这种方法也不一定奏效,可以将原csv的编码设定为ansi,全程用Resource和Target表示,编码形式为UTF-8,也可以实现。

5. gephi中graphviz的安装与设定

5.1 安装步骤

  1. 首先安装graphviz-2.38.msi;
  2. 安装pygraphviz的wheel文件;
  3. 将C:\Program Files (x86)\Graphviz2.38\bin加到PATH中(具体的路径根据自己的安装情况设定)

5.2 安装出现的问题

pygraphviz安装过程中,需要microsoft visual studio,但有时候由于版本的问题,可能有冲突,无法实现安装。
解决方法为:打开visual studio 2015,新建一个项目,软件会自动根据系统提供需要更新的模块,直接安装即可。

相关文章

  • 基于代谢物和代谢物反应的Gephi网络分析过程

    1.excel中代谢物简化 【注意】以下过程为vba编程 1.1 excel格式模板 1.2 vba代码 替换结束...

  • 人身体内的垃圾有哪些

    人身体内的垃圾就是指人体的代谢物,人体的代谢物分为两种水溶性的代谢物和脂溶性代谢物,水溶性代谢物通过肾脏然后随着尿...

  • 利用massdatabase包提取物种KEGG通路与基因/化合物

    最近手头处理一批代谢组数据, 想基于几十个关键差异代谢物代谢物进行下KEGG富集,能想到有两种方式解决,一种常用方...

  • 2月17日亲子阅读日记

    今晚阅读三本《代谢物》《巴巴爸爸的迷宫岛》《睡觉》。孩子问:妈妈,什么是代谢物?我回答说:人体排泄出来的废气,...

  • 代谢组差异代谢物分析简介

    差异代谢物分析 差异代谢物分析包括多元统计分析和单维统计分析,其中多元统计能捕捉到具有相互关联的差异性变量有利于代...

  • 一款制作前期分析图神器!

    GEPHI GEPHI是面向各种网络和复杂系统、动态图形和层次图形的交互式可视化和探索平台。是一款网络分析领域的数...

  • 代谢组学常用分析方法

    代谢组学是效仿基因组学和蛋白质组学的研究思想,对生物体内所有代谢物进行定量分析,并寻找代谢物与生理病理变化的相对关...

  • 使用Gephi生成网络图

    前言 Gephi是一款开源免费跨平台基于JVM的复杂网络分析软件, 其主要用于各种网络和复杂系统, 特别是在处理网...

  • 雨是时间的代谢物 一种荒芜 一种虚度

  • 试验假阴性原因分析

    1.组氨酸浓度、菌液浓度、S9浓度2.有几类致癌剂很容易在试验中呈假阴性反应,如抗代谢物、偶氮染料、类固醇、酰胺和...

网友评论

      本文标题:基于代谢物和代谢物反应的Gephi网络分析过程

      本文链接:https://www.haomeiwen.com/subject/mkppdqtx.html