短暂的成就感,是建立在别人19年甚至是18年16年写的教程上的。让我觉得真的落后很多很多。
知名教程写作的各位大佬救我狗命。
OK今天开始尝试能不能加一圈重复序列,如果可以的话再加一层共线性。争取这周把圈图画出来
昨天用下图处理得到了GC含量
https://yanzhongsino.github.io/2021/11/16/bioinfo_plot_Circos/现在想看看怎么提取TE浓度。应该是和基因的操作差不多。
Sequences and Genomic Features 5 Recreating Sequences & Features_哔哩哔哩_bilibili 我忘了之前我自己搬运的这个课 真的很基础 很好懂。
因为取GC含量的时候用到了bedtools,所以想学一下,有好多tools,
比如:samtools的安装和使用 - 简书 (jianshu.com),samtools是一个用于操作sam和bam文件的工具合集。
比如:bedtools的使用 - 简书 (jianshu.com),bedtools可以用来比较、操作、注释bed和gff文件中的genomic features。
bedtools主要功能:bedtools intersect -wao -a a.gtf -b b.bed
基因组数据文件类型:
Genome Browser FAQ (ucsc.edu)fasta:序列文件。
fastaq:带有测序质量的序列文件。
BED(Browser Extensible Data,字面意思是“(基因组)浏览器可延展数据”):bed文件格式解读-测序原理-数据格式-数据库-生信技能树 (biotrainee.com)。是一种基因组注释文件。
bam:bam文件是由比对软件将质控后的fq格式文件与参考基因组进行比对后的比对信息存储文件。Sam/Bam文件格式详解 - 简书 (jianshu.com)
gff:注释文件,有gff3,gff2类型,gff3用的多一些。
gtf:和gff文件格式相似,只差最后一行。gff和gtf转换可以用gffread,好像cufflinks也可以。
bed文件和gtf文件
网友评论