美文网首页
2021-02-28

2021-02-28

作者: Wu_tz | 来源:发表于2021-02-28 13:26 被阅读0次

本地blast后外显子拼接(好记性不如...)

        利用TBtools工具进行本地blast大致可分为三大步骤:1、得到目的序列所在的scaffold及其起始和终止位置;2、根据左右延长的起始终止位置得到所有外显子的序列;3、将所有外显子序列与query作两两比对,按照query位置将其拼接,从而完成CDS的提取。

        对于多外显子基因,此过程较为繁琐,以下命令行则避免了重复性操作,直接将多个物种的各外显子按顺序首尾连接。

(readme:运行目录下包括各个物种的文件,文件内容为该物种该基因的每个外显子序列,其格式为.fasta)

ls > all;for i in `cat all`;do sed -i -e '/>/d' $i;sed -i 'N;s/\n/ /g' $i;sed -i -e 's/\s//g' $i;sed -i -e "1i>$i" $i;done;for j in *.txt;do cat $j >>output.fas;echo >> output.fas;done

然后利用多序列比对,寻找GT-AG的方法找到剪切位点,使其简便而准确的获取目的CDS。

相关文章

网友评论

      本文标题:2021-02-28

      本文链接:https://www.haomeiwen.com/subject/gndgfltx.html