重测序比对流程

作者: 爱吃海椒的妹妹 | 来源:发表于2022-03-18 15:04 被阅读0次

此文章是用以查看操作步骤简化版,详细解释可见文章
全基因组重测序流程【超细致!!】 - 简书 (jianshu.com)

使用这些命令时,只要输入该命令就可以看到该命令如何使用,比如输入bwa index,就可以看到具体如何使用

一、比对

1、建立索引
对参考序列构建索引
bwa软件所在路径/bwa index 参考序列FASTA文件

image

2、比对及排序

$ bwa mem -t 4 -R '@RG\tID:foo_lane\tPL:illumina\tLB:library\tSM:sample_name' /path/to/human.fasta read_1.fq.gz read_2.fq.gz | samtools view -S -O bam -o - | samtools sort -@ 4 -m 4G -O bam -o demo3_name.sorted.bam

查看bam格式文件

samtools view demo.bam | less -S

以下是补充说明:
输入bwa men可以看到这个算法怎么使用,具体如下图)

image

代码解释:
-t,线程数,我们在这里使用4个线程:线程数是由电脑的内核决定的,一般这种简单的用4个线程就够了


image.png

此处的 -t 嗄 代表的是处理线程,越多速度越快。,该步骤处理时间较长。
具体可以设置多少线程视服务器而定。可通过下列代码查询,设置相关值。
grep 'physical id' /proc/cpuinfo | sort -u 查看CPU个数
grep 'core id' /proc/cpuinfo | sort -u | wc -l 查看核心数量
grep 'core id' /proc/cpuinfo | sort -u | wc -l 查看线程
cat /proc/meminfo 查看服务器内存(引自:対MS特技兵)

(\t)代表tab分隔符(\n则表示换行符)

-R read group header line 读取组标题行 用于后续区分这些样本

foo(第几泳道)可以从PE的fastq文件中找到

SM自己命名

二、比对文件的处理

1、标记重复

picard MarkDuplicates I=sample_name.sorted.bam O=sample_name.sorted.markdup.bam M=sample_name.markdup_metrics.txt

2、创建索引
a.为bam文件创建索引
让我们可以随机访问这个文件中的任意位置,后面的“局部重比对”步骤也要求这个BAM文件一定要有索引
生成的索引后缀是.bai

samtools index sample_name.sorted.markdup.bam

b.为参考序列创建索引
准备参考基因组.fai和.dict文件,局部重比需要这两个文件

gatk CreateSequenceDictionary -R genome.fa -O genome.dict && samtools faidx genome.fa 

作者:対MS特技兵
链接:https://www.jianshu.com/p/473a6208d7e5
来源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
作者:家和建材广场
链接:https://www.jianshu.com/p/2cca13963293
来源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

相关文章

  • 重测序比对流程

    此文章是用以查看操作步骤简化版,详细解释可见文章全基因组重测序流程【超细致!!】 - 简书 (jianshu.co...

  • 转录组测序—数据分析与解读

    流程概览 转录组测序的分析流程大致可以分成三类,包括基因组比对(Genome mapping)、转录组比对(Tra...

  • 全基因组测序——壹.简介

    技术原理 实验流程 分析流程分为以下6部分: 原始测序数据的质控 read比对,排序和去除重复序列 Indel区域...

  • 重测序分析(1)软件安装

    今天开启重测序分析专题啦!恳请各位观众老爷点点关注! 所有分析均在linux系统上完成整个重测序分析流程涉及到的软...

  • 易基因|干货:手把手教你做RNA m5C甲基化测序分析(RNA-

    本期,我们讲讲m5C RNA甲基化重亚硫酸盐测序(RNA-BS)实验怎么做,从技术原理、建库测序流程、信息分析流程...

  • 分析流程

    基因组重测序数据目的:需要检测基因组中的变异,找到并定位这些突变位点 条件:参考基因组、重测序数据、 分析流程: ...

  • 基因功能注释-SwissProt和Gene Ontology(四

    写在前面 前面的流程,我们已经可以 得到原始数据(下载或者自己测序) 质控和比对 定量 得到差异表达分析 差异表达...

  • ATAC比对率低

    处理了一批ATAC数据,用bowtie比对后发现比对率只有10-20%,打开原始测序fq文件,截取整条测序read...

  • HISAT-StringTie-Ballgown流程的解释(原理

    1、使用HISAT进行测序片段的比对 RNA测序数据分析的第一步是将测序数据比对到参考基因组上,以便于明确它们的位...

  • BWA和Bowtie的安装使用及区别

    本学期在学习谈老师讲的基因组重测序数据比对和变异检测软件这一章时,我们了解到了短序列比对软件主要有以下几种: 其...

网友评论

    本文标题:重测序比对流程

    本文链接:https://www.haomeiwen.com/subject/jixarrtx.html