1.文章来源

这篇文献主要研究的是OVOLs转录因子家族在乳腺癌中的表达模式以及预后价值。其实,从摘要部分就可以看到整篇文章主要用了4个在线数据库,分别是Oncomine、GEPIA、Kaplan-Meier Plotter以及cBioPortal databases。
数据库网址:
Oncomine: https://www.oncomine.org/
GEPIA: http://gepia.cancer-pku.cn
Kaplan-Meier Plotter: http://www.kmplot.com/
cBioPortal databases: http://www.cbioportal.org/
DAVID software :DAVID Functional Annotation Bioinformatics Microarray Analysis (ncifcrf.gov)

2.分析流程
1.1.表达模式的探索分析
这一部分文章主要是通过Oncomine数据库探索各个基因在不同类型乳腺癌样本和非肿瘤组织样本之间的转录水平的差异,然而,很遗憾的是,该数据库于2022年的1月17日终止了服务。


不管怎样,这一步的目的就是为了说明该转录因子家族在乳腺癌中转录水平发生了明显的变化,这里我们可以尝试利用GEPIA数据库进行替代,具体操作过程如下。
在数据库Exepression DIY选项卡中选择Boxplot选项,依次输入要查询的基因名字,以及癌种,点击plot进行绘制,即可得到下边的图片,点击右上角的下载按钮,就会得到一张高清的PDF图片。


此外,假如得到的基因不显著,我们想让它更显著,或者想调整箱子的颜色,可以点击下边的按钮进行设置,降低|Log2FC| Cutoff,提高p-value Cutoff均有可能让你感兴趣的基因获得显著性哦!但需要注意的是,p.value最大设置为0.05,如果高于0.05就没有统计学上的显著意义了。

如果在数据库Exepression DIY选项卡中选择Profile选项,那么会得到如下界面,基本的参数设置和之前一样,大家可以根据需求调整相应的参数,使得自己最后的结果呈现达到预期。


2.不同的临床特征下E2F转录因子转录水平的改变
这一部分,文章中使用的还是GEPIA平台,和刚刚步骤一样,这次我们选择Stage plot选项,将颜色修改为红色,即可得到和文章中一模一样的图片。


这里,其实我们还可以观察下其它的临床特征下基因的表达改变情况,但是由于GEPIA只提供了Stage选项,所以没有办法进行展示。
3.预后价值的探索
在这一部分,作者用了Kaplan-Meier Plotter(http://www.kmplot.com/)进行探索,这个工具使用很简单,根据自己的需要选择癌种,点进去

输入感兴趣的基因名字、分组标准以及研究的生存结局类型,在这一步,可选择的选项有很多很多,大家需要根据自己的需要来进行调整哈,然后点击页面下方绘图,即可得到K-M曲线,并进行下载得到高清PDF图片



4.E2F家族基因的基因组层面-突变分析
前边分析着重基于转录层面,最后,作者还观察了这些基因的基因组突变情况,用的是cbioportal网站(http://www.cbioportal.org/),依次点击研究的部位,选择研究的项目,并点击下方Query By gene

依次选择要展示的特征,这里选择突变和拷贝数变异,输入感兴趣基因,然后进行提交,即可得到基因的突变情况。


选择上方的cancerTypesSummary,即可得到各个基因突变类型的占比统计图,由于Cbioportal不断更新,所以部分图片和原始文章有所出入,但整体的操作大体一致,可以作为借鉴

以上就是我们本次分享的所有内容了,像这种利用公共数据库分析的文章有很多,大多见于研究某一个基因,某一类基因,比如家族基因,m6A调节因子等等在某一种癌症或泛癌中的研究,但前提是关注的基因确实要有显著性的差异,预后方面的价值,所以基因的选择很重要哦,假如你手上此时正有一批基因不知道如何研究,今天的分享相信一定会让你有一个新的idea出现,最起码可以作为一个预筛的过程,将基因进行一个降维,得到的新基因是不是就是可以作为后续深挖的重点了呢?
网友评论