该方法基于Python3.7实现,需要安装以下包: 新建文件夹作为工作空间,下载工程(无git的话去官网[http...[作者空间]
上节我们采用SELECT直接进行列信息提取,实际上可以在提取的同时创建与命名新的列。 以一个例子说明: 其中第一句...[作者空间]
SQL数据库的SELECT操作将是你学过的最为有用的数据操作技术之一。除了关系数据库,你能够在广泛的工具中找到它的...[作者空间]
简介 数据库是解决内存不足的另一方案,关系数据库存储一系列的表格,通过多个表格间的关系来提取与合并特定的信息。目前...[作者空间]
某些基因组文件(包括GFF,BED与VCF类型)特别大,无法读入到内存。然而需要随机地读取某些区域的信息的话,不读...[作者空间]
如果你经常在Linux系统安装软件的话,对Make工具一定不会陌生,它会执行一个makefile脚本,通过一个非常...[作者空间]
xargs是一个非常强力的工具,它可以对命令行输入的各个参数进行统一的操作(类似于find -exec命令)。 x...[作者空间]
前面我们提到pipeline处理多个文件有两种方式,一种是先读取存储数据信息的配置文件,另一种是直接通过一定的条件...[作者空间]
生物信息学中,很多数据分散在多个文件中,任何pipeline处理的核心都是通过某种方式对每个文件运行相同的流程,并...[作者空间]
bash中条件语句的基本格式为: 条件命令可以为程序,pipeline或test语句,唯有0退出码为真,其它值皆为...[作者空间]
变量 编写脚本难免用到各种变量,可以主动声明或者通过命令行参数获取,bash中变量没有数据类型(可以看作是字符串)...[作者空间]
学习生物信息的过程中难免需要编写繁复的pipeline,而bash脚本对构建pipeline帮助很大,它可以像胶水...[作者空间]
现在我们已经具备采用pysam模块统计比对信息的知识了,这里我们编写一个程序来统计BAM/SAM文件的信息并使用s...[作者空间]
pysam包使用AlignmentFile对象存储BAM/SAM文件,而通过AlignmentSegment对象存...[作者空间]
使用pysam包读取BAM/SAM文件返回的AlignmentFile对象包含丰富的属性。 header属性 he...[作者空间]
Pysam作为一个python模块可以读取与处理SAM/BAM文件,并提供了方便的对象与丰富的操作接口,让我们了解...[作者空间]
pileup文件是指通过BAM文件每个位置重叠的read对比对结果进行的总结,可用于判断各个位点突变的可能性。这里...[作者空间]
数据地址:NA12891_CEU_sample.bam[https://github.com/vsbuffalo/...[作者空间]
上节我们已经知道samtools view命令可以用于转换sam与bam文件类型,其实samtools view还...[作者空间]
一般来说除了查看文件,我们很少用到sam文件,大多数程序设计出来都是直接读取二进制的bam文件而不是sam文件字符...[作者空间]