美文网首页
2021-11-12bedtools学习

2021-11-12bedtools学习

作者: 阿乜太帅 | 来源:发表于2021-11-13 12:39 被阅读0次

    bedtools (https://bedtools.readthedocs.io/en/latest/index.html) 作为基因组数据处理的利器,适用于处理BED,BEDPE,GFF,GENOME,SAM/BAM及VCF类型数据,犹他大学昆兰实验室将其分成了不同的套件,以针对不同的需求。同时,灵活地组合使用这些套件,又可以完成一系列的高级需求

    常用:对bed文件排序的时候总是报错,可切换不同的sort方法

    sortBed -i  input.bed
    bedtools sort -i input.bed
    sort -k 1,1 -k2,2n input.bed
    sort -V -k 1,3 input.bed
    

    因为组件非常丰富,经常使用,特列笔记在此:

    suite 描述
    annotate 注释多个文件的覆盖特征
    bamtobed 将bam文件转换为BED格式
    bamtofastq 将bam文件转换为FASTQ格式
    bed12tobed6 将BED12间隔转换为BED6间隔
    bedpetobam 将BEDPE间隔转化为BAM格式
    bedtobam 将间隔转换为BAM记录
    closest 寻找最近的潜在的非重叠区间
    cluster 聚类(不合并)重叠的区间
    complement 获得区间的补集
    coverge 计算特定区间的覆盖
    expand 根据列值重复行数
    flank 从当前区间侧翼创建新的区间
    genomecov 从整个基因组计算覆盖深度
    getfasta 根据区间从FASTA文件中提取序列
    groupby 按特征列进行分组
    igv 创建一个IGV快照批处理脚本
    intersect 用各种不同的方式寻找重叠区域
    jaccard 计算b/w两个间隔区域的Jaccard统计量
    links 创建一个连接UCSC位点的HTML页面
    makewindows 创建基因组区间窗口
    map 为每个重叠区间队列应用一个函数
    maskfasta 利用区间隐藏FASTA文件序列
    merge 合并重叠区间形成一个新的区间
    multicov 计算多个BAM文件在特定区间的覆盖深度
    multiinter 标记多个区间文件的公共区间
    nuc 分析FASTA文件某区间的核酸含量
    overlap 计算两个区间重叠范围的长度
    pairtobed 找出以各种方式重叠区间的对
    pairtopair 找出以各种方式重叠其他配对的配对
    random 产生一个基因组的随机区间
    reldist 计算两个文件的相对距离分布
    shift 调整区间的位置
    shuffle 在基因组中随机重新分配时间间隔
    slop 调整区间的大小
    sort 对区间进行排序
    subtract 对两个区间文件取差集
    tag 根据区间的重叠区域标记BAM Tag
    unionbedg 根据多个BEDGRAPH文件合并覆盖区间
    window 在一个间隔周围的窗口寻找重叠区间

    相关文章

      网友评论

          本文标题:2021-11-12bedtools学习

          本文链接:https://www.haomeiwen.com/subject/fszazltx.html