美文网首页
使用TBtools进行本地blast并根据blast结果提取相关

使用TBtools进行本地blast并根据blast结果提取相关

作者: 惊鸿影 | 来源:发表于2022-04-22 10:57 被阅读0次

    <meta charset="utf-8">

    TBtools 是一个集合了超多生信处理的小工具,非常方便,而且是无命令行的操作,入门门槛极低。开发者是华南农业大学陈程杰博士,TBtools文章地址:https://www.biorxiv.org/content/early/2018/03/27/289660
    ,使用参考页面https://www.yuque.com/cjchen/hirv8i
    最近要使用本地blast来寻找组内基因组的相似序列,所以准备使用tbtools来试试。

    1.blast使用

    1.1 数据库构建

    参考网页https://zhuanlan.zhihu.com/p/418163788
    首先打开软件界面,选择BLAST→BLAST GUI Wrapper→Blast Zone 会出现如下界面

    image.png
    然后在这个界面先构建一个本地的数据库,作为blast的数据库。
    image.png
    可以点击config按钮来设置数据库的存放位置。
    image.png
    点击图中的加号就可以添加本地的数据来构建数据库了。
    image.png
    点击确定之后一段时间完成数据库构建
    image.png
    如果要添加更多的数据库操作类似,删除数据库的话直接选中数据库然后选择 “-”就行了。
    image.png
    image.png
    1.2 使用序列进行BLAST

    直接将需要BLAST的序列粘贴到input文本框中,选择好输出文件的格式、文件名和位置点击start就可以开始了(超短序列需要选择short mode)。


    image.png

    查看结果


    image.png
    结束之后,点击右下角的 Visulize 或TextView进行查看,Visulize有几种模式查看,点击之后在左上角出现图标选项,下拉选择之后再关掉就会出现显示的界面。
    如选择Aligmemt Shorer会出现如下的结果
    image.png

    选择Dot Plot会出现如下结果:



    选择Pileup Graph会出现如下结果

    而使用TextView则会显示文本信息如下:
    image.png
    (Frame = -1则表示是反向序列)

    这样就能看到BLAST所有结果的信息。

    2. 根据Blast结果提取对应序列

    提取对应序列需要使用tbtools中的Fasta Extract功能。


    image.png

    点击Sequence→Fasta tools→Fasta Extract (Recommended)进人Fasta Extract界面


    image.png

    从界面上来看,分为 6 大块,其中绝大多数是可选项(即可以不做调整)。

    1. Fasta 序列文件输入文本框,用户可以直接拖拽硬盘中的 Fasta 文件并放置到文本框中,路径会自动获取;也可以点击跟随文本框的摁钮“...”,在弹出文件选择框中选取对应文件即可
    2. Initialize 摁钮,在设置 Fasta 序列文件后,可以看到 Start 摁钮仍然不可点击。需要用户点击 Initialize 摁钮,创建 Fasta 序列索引文件(如前期已有,则会软件会自动复用,节省计算时间)
    3. 输出文件设置文本框,用户同样可以拖拽放置文件或者文件夹,程序会自动获取输出文件夹,用户需要补全一个输出文件名;当然也可以直接点击跟随文本框的摁钮,在弹出的问价选择框中设置对应输出文件即可
    4. 待提取序列信息设置框,参考界面说明,接受三种类型的提取模式:
      ● 基于 ID 的完整序列记录提取,如输入 Unigene_1 ... 等完整序列 ID,每行一个,即可提取完整序列记录
      ● 基于 序列坐标信息,进行序列区间截取,如提取染色体 Chr1 上第 10000 个碱基到 20000 个碱基的一段序列,那么输入如下。如果需要提取反向互补序列,使起始坐标大于终止坐标即可。

    # 注意,制表符[\t]分隔,而非空白[Space]分隔(试了下现在用空格好像也可以了)
    Chr1 10000 20000
    # 提取反向互补序列,则翻转碱基坐标
    Chr1 20000 10000

    提取坐标信息的功能,重命名区间,如我们需要提取 Peak 或者 Promoter 序列信息,并指定输出时序列名字

    peak_1 Chr1 10000 10200
    promoter_ATG8 Chr2 20300 22300

    相关文章

      网友评论

          本文标题:使用TBtools进行本地blast并根据blast结果提取相关

          本文链接:https://www.haomeiwen.com/subject/mkpsertx.html