美文网首页RNA-seq
如何做好一个版主-系统性的整理一个领域资料

如何做好一个版主-系统性的整理一个领域资料

作者: 因地制宜的生信达人 | 来源:发表于2017-11-11 18:47 被阅读0次

    我写这个,是基于我自己的一些思考,做的一个版主引导。

    首先,我们都是喜欢整理学习笔记并且热爱分享交流的,也期望通过这样的方式督促自己学习和获得正反馈。

    大家也看得出来,在我们生物信息学菜鸟团的引导下,有非常多的初学者加入了分享创作的队伍,但是大部分人的博客或者公众号的受众很有限,而且初学者掌握的知识面很单一,而且容易出错,所以我们搭建了这个生信技能树-论坛的平台,相当于一个自媒体中心。

    大家可以同时兼顾自己的学习分享帐号和论坛帐号(两方互相引流,增加受众和讨论),负责一个你最感兴趣或者你正在从事的有把握的板块,系统性的整理好一个入门指导系列资料,这样会更有成就感,也会有更多的互动,也能在某些领域积累声望。

    如果 我是WES版主,我会~~~

    如果我是想系统性的掌握全外显子测序数据分析技能,那么我可以通过做这个生信技能树的版主来加快这一进程。

    首先,我会了解全外显子测序的基本原理,如何从全基因组里面捕获全外显子序列,有哪些公司的芯片,优缺点是什么呢?外显子已经确定了吗?由哪个组织规定?外显子内含子,基因组版本的生物学概念要搞清楚。

    然后找几个公司的全外显子分析报告,看看它们分析了哪些点,还有找几篇引用率最高的综述,全外显子测序是什么时候提出来的?主要在哪些科研领域应用,在医疗领域应用如何?市场化程度如何?它跟全基因组比起来如何?

    当我们了解了全外显子需要分析哪些步骤,比如 QC-->alignment-->variation-calling-->variation-annotation-->visualization. 那么我们需要一个个步骤来看,比如QC一般做什么,有什么标准,使用哪些软件,( fastQC,fastx-toolkit,NGS-toolkit,cutadapt等等),QC的结果怎么看? 然后比对,比对一般选择什么策略?不同质量的测序数据比对有什么技巧吗?比对软件,bwa,bowtie,soap等等各有什么优缺点吗?比对软件发表时间越晚越好吗?有什么新的软件出来吗?其余的每个步骤类似,需要明白为什么做,怎么做,做什么,以及多种工具的比较,使用教程。

    做到这里,其实我们对WES数据分析就有了大致的了解了,但是需要实践,可以去找一些公共数据,开始处理一下,看看是不是每个步骤都是我们学习的那样出结果,中间会有什么gap?实践是检验真理的唯一标准。

    当然,这只是我个人的一些粗浅的思考草稿,欢迎大家跟帖讨论。

    福利时间到了,后台回复 WES 可以拿到外显子测序的各个公司的结题报告,加速你的学习成长过程,大概内容目录如下:

    一、质控(fastqc +tookit

    1数据质量:

    1)碱基质量分布

    2)reads质量分布

    3)reads长度分布

    4)GC含量

    2数据过滤

    1)原始reads数

    2)平均质量值>Q20 reads数目和比例

    3)平均质量值>Q30 reads数目和比例

    4)过滤掉reads中碱基质量<Q20的碱基占比超过5%的reads。统计clean data的reads和比例。

    二、比对(bwa)

    1)比对上基因组的reads数及占总数的比例

    2)完全匹配的reads数

    3)匹配上各个染色体的reads数

    4)染色体上的覆盖深度

    5)落在目标区域(exon)的reads数

    6)落在目标区域+-100的reads数

    7)目标区域碱基覆盖深度

    8)目标区域碱基被覆盖比例

    9)目标区域碱基被覆盖(50X,100X,150X,200X。。。)的比例

    三、find SNV(samtools +picard+gatk+varscan)

    1)picard :sam >sort.bam

    2)gatk :sort.bam >sort.dedup.bam (去重复)

    3)gatk :sort.dedup.bam > realign.bam (重新比对,indel和snp校正)

    4)Gatk :碱基质量重打分。(未进行)

    5)Varscan :call SNV

    四、突变注释

    1)annovar注释。

    2)注释结果统计(同义,非同义突变,基因上下游,内含子,外显子上。。等)

    3)dbsnp 注释(找到的snp是否在dbsnp数据库上)

    4) cosmic63 :癌症相关突变

    五、突变分析

    1)snv在个染色体上的分布

    2)各基因上snv的分布

    3)Snv位点较多的基因进行功能分析(pathway,kegg的通路分析和Go功能富集)

    记住:后台回复 WES 可以拿到外显子测序的各个公司的结题报告

    我们论坛的板块还有一些版主待认领,欢迎大家毛遂自荐,请先阅读:

    原文中此处为链接,暂不支持采集


    相关文章

      网友评论

        本文标题:如何做好一个版主-系统性的整理一个领域资料

        本文链接:https://www.haomeiwen.com/subject/glkgmxtx.html