美文网首页生信小白
生物信息百Jia软件(十七):flash

生物信息百Jia软件(十七):flash

作者: 基因学苑 | 来源:发表于2019-08-08 21:31 被阅读2次

    欢迎订阅WX众号:基因学苑,更多精彩内容等你发掘!

    基因学苑Q群:32798724

    编者按

    前面写了专题《手把手教你生物信息分析平台搭建》,然后又介绍了很多《生物神奇网站》资源,也介绍了《生物信息之独孤九剑》Linux操作。那么万事俱备,就开始学习生物信息吧。所以,我们开始新的篇章——《生物信息百jia软件》。百Jia是什么意思呢?可以是百佳,也可以是百家,还可以是百加。从100家中选择100款优秀软件,掌握这些软件,就可以扩展出更多内容,这就是百Jia。

    一、功能分类: 

    连接pairend reads

    二、软件官网:

    http://ccb.jhu.edu/software/FLASH/index.shtml

    三、软件介绍:

    FLASH 的全称为Fast Length Adjustment of SHort reads。如果两条reads的总长大于原始测序片段的长度就可以使用flash进行连接。连接出来的长片段可以明显改善序列的拼接效果,原来基因kmer 的拼接方法,现在可以使用基于overlap的拼接软件,两种拼接测序完全不一样。然后在利用没有连接的reads之间的overlap关系,构建scaffold,这样就充分利用了数据。在转录组研究中,合并出来更长的片段甚至可以达到一个转录本的全长,可以极大提高分析结果的准确性。

    四、下载安装: 

    tar -zxvf FLASH-1.2.11.tar.gz

    cdFLASH-1.2.11/

    make

    五、软件使用: 

    要想输出所有选项,可以加--help。每个选项都给出了详细的介绍。

    flash --help

    -m 连接overlap最小接受的阈值,默认10bp

    -M 连接overlap最大接受的阈值

    -x 最大允许的错配比率,默认0.25

    -O 尝试matepair模式reads方向的连接

    -p phred质量值体系,默认为phred 33,早期的illumina测序数据采用phred 64

    -r reads长度

    -f 片段长度,也就是测序的文库大小

    -s 文库的偏差

    -o 输出前缀

    -d 输出目录

    -c 屏幕输出结果

    -z 输出压缩格式结果

    -t 设置线程数,flash软件支持多线程,速度快。 

    -q 不输出屏幕信息

    -h 输出帮助信息

    -v 输出软件版本信息

    六、使用案例: 

    flashread1.fqread2.fq-p33-r250-f500-s100-ooutput

    七、注意事项:

    1、flash相对与cope软件不能基于kmer方法的连接,但是软件运行速度相对快一些。

    2、软件默认会输出很多的结果,包括连接好的reads,分别输出没有用于连接的reads,统计数据等,可用于绘制直方图。

    欢迎加入QQ群—基因学院:32798724。

    如果觉着不错,欢迎点赞+转发

    相关文章

      网友评论

        本文标题:生物信息百Jia软件(十七):flash

        本文链接:https://www.haomeiwen.com/subject/kvgfjctx.html