美文网首页生信科研
如何筛出一篇5分文章的核心基因

如何筛出一篇5分文章的核心基因

作者: 科研菌 | 来源:发表于2020-03-22 22:07 被阅读0次
    欢迎关注「科研菌」

    新冠让大家都只能蜷曲在家中。有人调侃因为武汉肺炎可能中国能多不少牛顿级别的人物!当然也出现了不少科研文章套路课程的百花齐放,其中的确有很多优秀的课程,讲述了不少方法学和文献精读学习。今天和大家聊聊如何快速进行5分的套路文章,对于国自然构思和写作也会有一定的帮助,因为笔者比较懒,所以不知道下次是什么时候更新了~

    我们第一讲来讨论一下如何去筛选一个你中意的核心变量。核心变量作为文章最主要的变量之一,它可以是一个基因,蛋白,通路,抑制剂,年龄,性别等等;我以一些案例来和大家聊一聊如何对一篇5分的文章进行筛选,以后的推送再慢慢讲解一些筛选出来的文章如何进行扩展的分析。


    首先讲一些对数据集筛选的原则:

    1.讨论的问题尽量具体的数据集 (疾病条件/干预条件等);

    2.筛选来源尽量大于等于2个,尽量选择样本数较大数据集;

    3.尽量避免合并成大数据集 (推荐各个数据集相对独立进行处理);


    Case1 筛选一个肿瘤生存相关的基因

    这个议题相信是很多小伙伴刚刚入门的时候都会选择的,但是大家来考虑一下如下几个题目你会更对哪个感兴趣?

    1肺癌中生存相关的转录组分析筛选

    2晚期肺腺癌的生存相关的转录组分析筛选

    3EGFR-TKIs耐药的晚期肺腺癌的生存相关的转录组分析筛选

    随着问题越来越具体,是不是感觉筛选出来的问题就是有血有肉的感觉了?慢慢从一个很泛的问题慢慢集中到一个具体的问题。当然还可以更具体,比如说:限定为某一类EGFR-TKIs;限定病人治疗为一线EGFR-TKIs治疗后耐药的;耐药后出现某一种特征性的突变;转录组可以限定为免疫相关的基因或者是某一些特定的通路相关的所有基因;et al.

    不管是在选题还是写文章的时候,你的文章都需要把问题具体化才更有吸引力。解决的问题越具体,你之后能够深入讨论的空间反而越大,也越容易更深入地去探讨机制。

    注意:突然想起最近的几篇2-5分文章的审稿,他们居然有一个通病:通过肿瘤组织和正常组织的差异分析来筛选生存相关的mRNA (或者是某个lncRNA)。首先这个推论都是经不起推敲的,为什么肿瘤组织中高表达的RNA就一定指向了生存预后差?其次,为什么不用生存数据去直接筛选?

    Case2 筛选一个Risk Score

    相信大家最近看到很多文章是关于一些通路分数计算的。Risk Score这里面门道特别多,这一次很难给大家详细的说,但是可以大致列出来一些关键的问题,如下:

    1.仍然是研究的问题一定要很具体这既是大部分不具体的问题别人可能已经发过了;也是因为具体的问题会让人觉得你的专业性更强;

    2.Risk Score的计算方式很多,可以用加权分数,也可以通过一些现成的R包进行估算,有的文章会自己构建通路Signature进行分析,大家也可以回去看看;

    3.Risk Score的来源很多,可以是mRNA,miRNA,lncRNA,某个通路的Signature Score,总体/部分免疫细胞的一些Signature Score等;关于“某个通路的Signature Score”,大家可以学习一下GSEA;至于“某个通路”,可以具体到某个具体的通路,比如说IL-1相关的通路,也可以是“自噬”相关的通路集合等;

    4.纳入Risk Score的因素降维的问题;

    这里的核心问题,尽量是你筛选出来的,而不是查阅文献来的,不然后面做扩展的分析或者是写基金,都会显得非常无力;

    Case3 筛选一个肺腺癌顺铂耐药的基因

    当然这个小标题本身也是不够具体,研究耐药的小伙伴都知道,在每个领域都会有一些比较公认的细胞系;不同的药物敏感的细胞系也不一样,研究原发耐药和继发耐药又不一样。

    1.你如果手里资源有限,你可以只做一个细胞系的耐药机制研究也是可以的,比如说A549细胞系继发耐药后和本身做对比,筛选出来了以后再干预一下补充机制研究;这里面也是有一些tricky的地方的,你筛选耐药的基因  ,可以通过长期梯度药物浓度诱导细胞系,逐渐发生耐药,让细胞在最开始的IC50值的压力下逐渐适应更高浓度的药物浓度;也可以用特定浓度的药物对细胞系进行处理特定的时长,然后对那些处理后的细胞系样本进行测序后筛选;

    注意:两种方式都是有问题的,比如说第一种方式,长期的一个药物刺激虽然能够让细胞系耐药,但是可能细胞本身的状态,进而导致具有较大的异质性。

    2.利用GEO中一些数据集 (如:具备继发耐药组和control组的肺腺癌细胞系)进行筛选,对于很多课题组而言反而是一个更为现实的方式。因为对于化疗的诱导耐药细胞株,实在是太难了;当然可能有一些商用的细胞系,但是请你一定一定要到STR或者是自己去做STR鉴定,不然肯定坑得你死去活来的;

    很可能这大半年的时间就这样没有了,功能实验做得怀疑人生。这不是你的错,国内的不少商用细胞系是被污染或者是假的;

    关于核心基因筛选的我们就暂时讲到这里,希望大家能有所收获!大家点击在看,「如果超过30」,我就更新下一期《筛到5分的核心基因以后你可以怎么做?》吧。Thanks!

    此外,如果大家有什么想要进一步讨论的,可以在公众号后台私信我们,或者是在下方留言和我们共同讨论。

    扫上方二维码即可关注科研菌

    相关文章

      网友评论

        本文标题:如何筛出一篇5分文章的核心基因

        本文链接:https://www.haomeiwen.com/subject/enkbyhtx.html