美文网首页生信分析
bioinfo100-第7题-读懂FastQC报告 Part I

bioinfo100-第7题-读懂FastQC报告 Part I

作者: RachaelRiggs | 来源:发表于2020-05-10 22:08 被阅读0次

    zhn-blog
    mhw-zh

    Hello 大家好!

    今天我们接着昨天的话题来继续进行与FastQC结果有关的提问。

    我们昨天主要是针对FastQC结果中的boxplot进行了相关的探索,boxplot一般是认为FastQC几张必看的质控图之一。一般情况下FastQC的结果会包含下面几个图,而我们主要会看下图圈出来的几个。

    image.png

    接下来的几天我们就把这些图来一个一个讨论清楚。

    我们昨天讨论了“Per base sequence quality”,今天先来讨论 “Per base sequence content”

    image1 image2

    问题:

    1. 图1与图2中横坐标是什么意思?纵坐标是什么意思?

    横轴代表1到150bp;纵轴代表ATCG在该bp的百分比。

    2. 图1是1个正常的DNA 全基因组测序结果,为什么前面的几bp线是波动的?后面的线是平衡的?

    根据Wason-Crick配对原则,A和T应该相等,G和C应该相等

    但是一般测序的时候,刚开始测序仪状态不稳定,很可能出现不平衡的情况

    像这种情况

    如果测序的得分很高,可以不进行trim起始部分的序列信息

    如果测序得分很低,需要进行trim起始部分的序列信息

    3. 在图1中你能不能看出一个恒定的量?(提示,同一物种间相同,不同物种间一般不同)如果能看出来,这个量是什么?数值大约是多少?

    GC含量在同一物种中是一个恒定值。

    图1中GC总体比例大约在42%(目测)

    相关文章

      网友评论

        本文标题:bioinfo100-第7题-读懂FastQC报告 Part I

        本文链接:https://www.haomeiwen.com/subject/dsnsnhtx.html