欢迎订阅WX众号:基因学苑,更多精彩内容等你发掘!
基因学苑Q群:32798724
编者按
前面写了专题《手把手教你生物信息分析平台搭建》,然后又介绍了很多《生物神奇网站》资源,也介绍了《生物信息之独孤九剑》Linux操作。那么万事俱备,就开始学习生物信息吧。所以,我们开始新的篇章——《生物信息百jia软件》。百Jia是什么意思呢?可以是百佳,也可以是百家,还可以是百加。从100家中选择100款优秀软件,掌握这些软件,就可以扩展出更多内容,这就是百Jia。
一、功能分类:
连接pairend reads
二、软件官网:
http://ccb.jhu.edu/software/FLASH/index.shtml
三、软件介绍:
FLASH 的全称为Fast Length Adjustment of SHort reads。如果两条reads的总长大于原始测序片段的长度就可以使用flash进行连接。连接出来的长片段可以明显改善序列的拼接效果,原来基因kmer 的拼接方法,现在可以使用基于overlap的拼接软件,两种拼接测序完全不一样。然后在利用没有连接的reads之间的overlap关系,构建scaffold,这样就充分利用了数据。在转录组研究中,合并出来更长的片段甚至可以达到一个转录本的全长,可以极大提高分析结果的准确性。
四、下载安装:
tar -zxvf FLASH-1.2.11.tar.gz
cdFLASH-1.2.11/
make
五、软件使用:
要想输出所有选项,可以加--help。每个选项都给出了详细的介绍。
flash --help
-m 连接overlap最小接受的阈值,默认10bp
-M 连接overlap最大接受的阈值
-x 最大允许的错配比率,默认0.25
-O 尝试matepair模式reads方向的连接
-p phred质量值体系,默认为phred 33,早期的illumina测序数据采用phred 64
-r reads长度
-f 片段长度,也就是测序的文库大小
-s 文库的偏差
-o 输出前缀
-d 输出目录
-c 屏幕输出结果
-z 输出压缩格式结果
-t 设置线程数,flash软件支持多线程,速度快。
-q 不输出屏幕信息
-h 输出帮助信息
-v 输出软件版本信息
六、使用案例:
flashread1.fqread2.fq-p33-r250-f500-s100-ooutput
七、注意事项:
1、flash相对与cope软件不能基于kmer方法的连接,但是软件运行速度相对快一些。
2、软件默认会输出很多的结果,包括连接好的reads,分别输出没有用于连接的reads,统计数据等,可用于绘制直方图。
欢迎加入QQ群—基因学院:32798724。
如果觉着不错,欢迎点赞+转发
网友评论