美文网首页
拆分,合并染色体序列

拆分,合并染色体序列

作者: 一直想要成为大牛的科研狗 | 来源:发表于2020-09-15 10:09 被阅读0次

由于序列长度大于512Mb的染色体会造成bwa和bedtools的报错,所以需要拆分。
测序中unanchored scaffolds的需要在整合成一条染色体chrUn,来进行后续的WGC分析故需要合并在一起。
这是相关命令:

###拆分染色体,首选选取节点
$ m10 chr5_2parts.bed
chr5LG3 0   419514300
chr5LG3 419514300   579269071
$ m10 chaifen.sh
#/usr/bin/bash
bedtools getfasta -fi chr5.fa -bed chr5_2parts.bed -fo chr5_2parts.fasta
less chr5_2parts.fasta |seqkit grep -f chrlist >chr5_part1.fa
less chr5_2parts.fasta |seqkit grep -f chrlist >chr5_part2.fa
###合并scaffolds to chr。同样需要.bed
$ m10 chrun2part.bed
scaffold03481   0   68434
scaffold03482   0   131982
scaffold03483   0   131980
scaffold03484   0   66466
scaffold03485   0   36393
scaffold03486   0   133068
scaffold03487   0   61210
scaffold03488   0   69082
scaffold03489   0   131627
scaffold03490   0   131625
$ m10 hebing.sh
#/usr/bin/bash
bedtools getfasta -fi Pisum_sativum_v1a.fa -bed chrun1part.bed -fo chrun1.fasta
grep "^>" -v chrun1.fasta | awk '{ ORS = "NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN"; $1 = $1; print $0}' > chrUn1.fasta
fold -w 80 chrUn1.fasta > chrUnplaced1.fasta
sed -i '1 i\>chrUn1' chrUnplaced1.fasta
##换行的问题需要追加个N
echo “N” >>chrUnplaced1.fasta

相关文章

  • 拆分,合并染色体序列

    由于序列长度大于512Mb的染色体会造成bwa和bedtools的报错,所以需要拆分。测序中unanchored ...

  • 排序算法之归并排序

    归并算法简单介绍 归并算法的核心是:先拆分然后再合并。 拆分原则:先将序列折半进行拆分,当子序列只有一个元素时停止...

  • 排序算法之快速排序

    概念 上篇文章我们讨论了归并排序,其核心思想是每次将待排的序列拆分为两部分,最终合并成一个序列。简单理解拆分为二叉...

  • 4个PG基因组SSRs数量分布

    一、统计tns不同染色体上SSR分布 重命名序列名,使用sed命令(1)先修改染色体序列名称 (2)重新查看序列名...

  • Java----IO操作

    Java----IO流操作 1、基础操作 2、补充要点 2.1、文件的拆分与合并 2.2、对象的序列化输出输入:将...

  • 时间复杂度为O(nlogn)的算法

    mergeSort 口诀: 左拆分,左合并,右拆分,右合并,最后合并左右。 归并排序的逻辑 归并排序的战略(宏观)...

  • 分解javascript归并排序

    掌握算法,先理解原理 采用分而治之的策略拆分 --> 取值 --> 合并 把长度为n的输入序列分成两个长度为n/2...

  • 数据分析课程-【用数据说话-EXCEL的超实用宝典】

    数据导入 文本,设置文本分隔符和文本原始格式 数据拆分合并 拆分:分列,分隔符号、固定宽度 数据合并:使用数据合并...

  • pytorch 合并和拆分

    ​今天说一说 tensor 合并和拆分,下面是 pytorch 中用于对 tensor 进行拆分和合并 Api。A...

  • 从fasta序列里面模拟测序的reads走SNP-calling

    很简单的一个shell脚本,从UCSC里面单独下载X,Y染色体的fasta序列,写脚本从Y染色体序列里面模拟双端测...

网友评论

      本文标题:拆分,合并染色体序列

      本文链接:https://www.haomeiwen.com/subject/xtbxyktx.html