Kegg通路或者GO本体论富集分析是基因功能注释最常见的分析,结果可以以多种形式展示,最常用的包括:条形图/bar图,气泡图/dot图等,其中气泡图输入数据一般包括以下4个维度的信息:
名字,富集倍数(或者gene ratio),P值,基因count。
例如:
pathwayenrichmentpvaluecount
RNA transport4.8072586411.56E-0515
Epstein-Barr virus infection4.5692617482.70E-0516
HTLV-I infection3.8146165210.00015324417
Tuberculosis3.4541809410.00035141413
MAPK signaling pathway3.3781315810.00041866716
Neurotrophin signaling pathway3.2121029710.00061361710
Long-term potentiation3.0000352660.0009999197
Dopaminergic synapse2.9670264550.00107888110
Endocytosis2.8413167310.00144106415
Herpes simplex infection2.7752191730.00167795712
4维分析结果
做出来的例图如下(微生信平台免费在线做气泡图)
![](https://img.haomeiwen.com/i25379306/052a019b569d2b96.png)
富集气泡图
该图包含的4维信息有:
1.Y轴的通路名(pathway,结果表格的第一列)
2.X轴的富集倍数(enrichment,结果表格的第二列)
[3.点的颜色(P值,结果表格的第三列)
4.点的大小(count,该通路中包含的基因与输入基因列表交集的基因数)。
其中基因的信息就丢失了,那么我们能否将基因的信息也加入到图中呢?答案是肯定的!
让我们先来看看5维的分析结果,以clusterProfiler结果为例:
DescriptionGeneRatiopvaluegeneIDCount
Circadian rhythm0.0140850.010497623RORA/RORB2
NOD-like receptor signaling pathway0.0281690.03303255CASP8/TRIP6/MAPK8/CASP14
PPAR signaling pathway0.0281690.008761306CD36/AQP7/LPL/CYP4A114
Viral myocarditis0.0281690.009484362CASP8/MYH7/SGCB/SGCD4
Hypertrophic cardiomyopathy (HCM)0.0422540.014532337MYH7/MYL2/MYL3/SGCB/SGCD/SLC8A16
Dilated cardiomyopathy0.0422540.020924238MYH7/MYL2/MYL3/SGCB/SGCD/SLC8A16
Osteoclast differentiation0.0492960.034284302LILRB5/MAPK8/FHL2/FCGR1A/IFNGR2/FOS/LILRB37
Phagosome0.0492960.018180176TUBA3D/THBS4/SFTPD/CD36/FCGR1A/TUBA3E/DYNC1I17
Huntington's disease0.0563380.001736229TBPL1/CASP8/VDAC3/CREB5/PPID/CLTB/NDUFA12/GRIN2B8
5维分析结果
根据这里的基因,我们可以在气泡图的基础上,添加一个基因维度,列出基因名字。若下图所示(瞬间眼前一亮有没有)
![](https://img.haomeiwen.com/i25379306/c770b6c387f34544.png)
升级版的5维富集气泡图
该图左侧为基因,右侧为常规的气泡图。
包含的5维信息有:
1.Y轴的通路名(pathway,结果表格的第一列)
2.X轴的基因ratio(gene ratio,结果表格的第二列)
3.点的颜色(P值,结果表格的第三列)
4.基因名字(结果表格的第四列,图中左侧的桑吉图,连线表示隶属关系)
5.点的大小(count,结果表格的第五列)
秉承一贯简洁的作用,微生信平台支持直接输入数据,就可以做出来这张桑吉气泡图,尝鲜版,赶紧试试吧!
网友评论