如何做好一个版主-系统性的整理一个领域资料

作者: 因地制宜的生信达人 | 来源:发表于2017-11-11 18:47 被阅读0次

我写这个，是基于我自己的一些思考，做的一个版主引导。

首先，我们都是喜欢整理学习笔记并且热爱分享交流的，也期望通过这样的方式督促自己学习和获得正反馈。

大家也看得出来，在我们生物信息学菜鸟团的引导下，有非常多的初学者加入了分享创作的队伍，但是大部分人的博客或者公众号的受众很有限，而且初学者掌握的知识面很单一，而且容易出错，所以我们搭建了这个生信技能树-论坛的平台，相当于一个自媒体中心。

大家可以同时兼顾自己的学习分享帐号和论坛帐号(两方互相引流，增加受众和讨论)，负责一个你最感兴趣或者你正在从事的有把握的板块，系统性的整理好一个入门指导系列资料，这样会更有成就感，也会有更多的互动，也能在某些领域积累声望。

如果 我是WES版主，我会~~~

如果我是想系统性的掌握全外显子测序数据分析技能，那么我可以通过做这个生信技能树的版主来加快这一进程。

首先，我会了解全外显子测序的基本原理，如何从全基因组里面捕获全外显子序列，有哪些公司的芯片，优缺点是什么呢？外显子已经确定了吗？由哪个组织规定？外显子内含子，基因组版本的生物学概念要搞清楚。

然后找几个公司的全外显子分析报告，看看它们分析了哪些点，还有找几篇引用率最高的综述，全外显子测序是什么时候提出来的？主要在哪些科研领域应用，在医疗领域应用如何？市场化程度如何？它跟全基因组比起来如何？

当我们了解了全外显子需要分析哪些步骤，比如 QC-->alignment-->variation-calling-->variation-annotation-->visualization. 那么我们需要一个个步骤来看，比如QC一般做什么，有什么标准，使用哪些软件，( fastQC,fastx-toolkit,NGS-toolkit,cutadapt等等)，QC的结果怎么看？然后比对，比对一般选择什么策略？不同质量的测序数据比对有什么技巧吗？比对软件，bwa,bowtie,soap等等各有什么优缺点吗？比对软件发表时间越晚越好吗？有什么新的软件出来吗？其余的每个步骤类似，需要明白为什么做，怎么做，做什么，以及多种工具的比较，使用教程。

做到这里，其实我们对WES数据分析就有了大致的了解了，但是需要实践，可以去找一些公共数据，开始处理一下，看看是不是每个步骤都是我们学习的那样出结果，中间会有什么gap？实践是检验真理的唯一标准。

当然，这只是我个人的一些粗浅的思考草稿，欢迎大家跟帖讨论。

福利时间到了，后台回复 WES 可以拿到外显子测序的各个公司的结题报告，加速你的学习成长过程，大概内容目录如下：

一、质控（fastqc +tookit）

1数据质量：

1）碱基质量分布

2）reads质量分布

3）reads长度分布

4）GC含量

2数据过滤

1）原始reads数

2）平均质量值>Q20 reads数目和比例

3）平均质量值>Q30 reads数目和比例

4）过滤掉reads中碱基质量<Q20的碱基占比超过5%的reads。统计clean data的reads和比例。

二、比对（bwa）

1）比对上基因组的reads数及占总数的比例

2）完全匹配的reads数

3）匹配上各个染色体的reads数

4）染色体上的覆盖深度

5）落在目标区域（exon）的reads数

6）落在目标区域+-100的reads数

7）目标区域碱基覆盖深度

8）目标区域碱基被覆盖比例

9）目标区域碱基被覆盖（50X，100X，150X，200X。。。）的比例

三、find SNV（samtools +picard+gatk+varscan）

1）picard ：sam >sort.bam

2）gatk ：sort.bam >sort.dedup.bam (去重复)

3）gatk ：sort.dedup.bam > realign.bam (重新比对，indel和snp校正)

4）Gatk ：碱基质量重打分。（未进行）

5）Varscan ：call SNV

四、突变注释

1）annovar注释。

2）注释结果统计（同义，非同义突变，基因上下游，内含子，外显子上。。等）

3）dbsnp 注释（找到的snp是否在dbsnp数据库上）

4） cosmic63 ：癌症相关突变

五、突变分析

1）snv在个染色体上的分布

2）各基因上snv的分布

3）Snv位点较多的基因进行功能分析（pathway，kegg的通路分析和Go功能富集）

记住：后台回复 WES 可以拿到外显子测序的各个公司的结题报告

我们论坛的板块还有一些版主待认领，欢迎大家毛遂自荐，请先阅读：

原文中此处为链接，暂不支持采集

网友评论

RNA-seq

本文标题：如何做好一个版主-系统性的整理一个领域资料

本文链接：https://www.haomeiwen.com/subject/glkgmxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

如何做好一个版主-系统性的整理一个领域资料

二、比对（bwa）

三、find SNV（samtools +picard+gatk+varscan）

四、突变注释

五、突变分析

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

RNA-seq