fastq1和fastq2特定的cluster的序列
- @SRR8980088.3 fastq的identifier
- 基于此可以找到下机数据中该编号对应的序列;
a=/trainee/vip13/test
####查看对应的序列
zcat /trainee/vip13/test/SRR8980088_2_val_2.fq.gz|grep -A1 'SRR8980088.3'|head -n2|grep -v @
zcat /trainee/vip13/test/SRR8980088_1_val_1.fq.gz|grep -A1 'SRR8980088.3'|head -n2|grep -v @
![](https://img.haomeiwen.com/i13774856/c8434e6bcd53c0e9.png)
fastq1
![](https://img.haomeiwen.com/i13774856/1dc0e8b1209b322e.png)
fastq2
fastq在SAM|BAM文件中的展示
- 基于此,可以在SAM/BAM文件中找到,其比对到fasta上的序列
- 在这里的体现是:fastq1与fa方向一致,fastq2与fa反向互补;
cat /trainee/vip13/test/SRR8980088.sam|grep SRR8980088.3|head -n2|cut -f1,10
![](https://img.haomeiwen.com/i13774856/d3f36ba1bcb5d0a8.png)
SAM/BAM
Fastq中的read在fasta中的位置-SAM/BAM
- 上述identifier由比对结果看,位于chr1;
- 从fasta中将chr1序列提取出来,截取出其对应的碱基位置,进行查看;
- 依据,SAM中对于pos的解释,为比对上的reference左端的位置,所以,最后截取的reference的位置,为
左(小)~(左(大)+读长-1)
,这也就是echo $((110954876+149))
的来由;
-
grep -i
所跟序列为SAM|BAM中所对应的比对序列;
![](https://img.haomeiwen.com/i13774856/7d79329f2226c0f2.png)
sam/bam/pos
![](https://img.haomeiwen.com/i13774856/b2549380c211e026.jpg)
lib_PEseq.jpg
##从fa文件将chr1序列提取出来
zcat /trainee/vip13/test/hg38.fa.gz |sed -n '/chr1$/,/chr10$/p' > test.txt
###需要精确确定位置,所以,chr的字样需要去除
cat test.txt |grep -v '>chr' > chr1.txt
echo $((110954876+149))
###相应的,换行符等也要去掉
cat /trainee/vip13/test/chr1.txt |tr -d '\n'|cut -c 110954736-110955025|grep -i
![](https://img.haomeiwen.com/i13774856/70dab7565e788828.png)
sam_fq1
![](https://img.haomeiwen.com/i13774856/6da2039cb89112f7.png)
sam_fq2
网友评论