VCF文件转化为注释BED文件

作者: 落寞的橙子 | 来源:发表于2019-05-22 01:30 被阅读1次
###Get the indels for vcf this is now the bed files
#!/bin/bash
ml bedops
data_dir=yourdir/VariantFiltration
output_dir=yourdir/Indel_vcf
snvs_dir=yourdir/Indel_vcf/snvs
insertions_dir=yourdir/insertions
deletions_dir=yourdir/deletions
mkdir -p $output_dir
mkdir -p $snvs_dir
mkdir -p $insertions_dir
mkdir -p $deletions_dir
ls *.vcf | while read i ;
do
vcf2bed --snvs < $data_dir/${i} > $snvs_dir/${i%_VariantFiltration.vcf*}_snvs.vcf
vcf2bed --insertions < $data_dir/${i}> $insertions_dir/${i%_VariantFiltration.vcf*}_insertions.vcf
vcf2bed --deletions < $data_dir/${i} > $deletions_dir/${i%_VariantFiltration.vcf*}_deletions.vcf
cat $insertions_dir/${i%_VariantFiltration.bed*}_insertions.vcf $deletions_dir/${i%_VariantFiltration.bed*}_deletions.vcf > $output_dir/${i%_VariantFiltration.bed*}_all_indel.bed
done


#############Get gene names form the location
###Get the bed file for Long non-coding RNA gene annotation (Genecode V30)
wget ftp://ftp.ebi.ac.uk/pub/databases/gencode/Gencode_human/release_30/gencode.v30.long_noncoding_RNAs.gff3.gz
#get the bed file for the lncRNAs exon region
perl -alne '{print if $F[2] eq "exon"}' gencode.v30.long_noncoding_RNAs.gff3 |cut -f 1,4,5 > lncRNA_exonV30.bed
#get exon gtf
perl -alne '{print if $F[2] eq "exon"}' gencode.v30.annotation.gtf >gencode.v30.annotation.exon.gtf
#or
#gtf2bed < annotations.gtf | grep 'exon' - | bedops --element-of 1 tags.bed - > tags_overlapping_exons.bed
#gtf2bed --do-not-sort < gencode.v30.annotation.exon.gtf > gencode.v30.annotation.exon.bed
gtf2bed < gencode.v30.annotation.exon.gtf > gencode.v30.annotation.exon.bed
#!/bin/bash
ml java
ml bedops
bed_dir=yourdir/hg38/gencode.v30.annotation.exon.bed
soft_dir=yourdir/biosoft/snpEff_latest_core/snpEff/SnpSift.jar
output_dir=yourdir/Indel_vcf/all_indels_annotation
data_dir=yourdir/Indel_vcf/all_indels
tmp_dir=$output_dir/tmp
mkdir -p $output_dir
mkdir -p $tmp_dir
ls *.vcf| while read i ;
do
cat $data_dir/${i} | java -jar $soft_dir intervals $bed_dir | awk -v OFS="\t" '{print $1,$2,$3}' > $tmp_dir/${i%_all_indel.vcf*}_all_indels_tmp.bed
bedtools intersect -a $tmp_dir/${i%_all_indel.vcf*}_all_indels_tmp.bed  -b $gtf_dir -wb | awk -v OFS="\t" '{print $1,$2,$3,$6,$13,$15,$17,$19}' > test.txt
done


相关文章

  • VCF文件转化为注释BED文件

  • 【生信】格式转换:转成bed及bed12格式

    基因组注释gtf文件或bed6文件转bed12文件 上一篇详细介绍了bed格式,尤其清楚的解释了bed格式中的最后...

  • 2018-10-11 使用plink1.9 和plink2 把

    上次我是把bed bim fam 转成 vcf ,这次反过来,我已有的vcf 文件,要转成 bed bim fam...

  • GWAS - plink文件类型

    plink文件类型 Plink常见格式有五种:ped,map,bed,fam,bim PLINK接受VCF文件作为...

  • annovar注释除人类以外SNP

    快速注释已经得到的vcf文件 所需文件 ref.fa gff3文件或者gtf vcf文件 简单流程 1.建立一文件...

  • bigwig转bed文件

    bigwig转bed文件首先需要将bigwig转为wig文件 利用BEDOPS的 wig2bed]将wig文件转 ...

  • bed文件

    BED (Browser Extensible Data)格式文件就是通过规定行的内容来展示注释信息 BED文件每...

  • BED 文件格式

    BED (Browser Extensible Data)格式文件就是通过规定行的内容来展示注释信息 BED文件每...

  • Tabix— bgzip操作

    tabix 可以对NGS分析中常见格式的文件建立索引,从而加快访问速度,不仅支持VCF文件,还支持BED, GFF...

  • tabix 操作VCF文件

    tabix 可以对NGS分析中常见格式的文件建立索引,从而加快访问速度,不仅支持VCF文件,还支持BED, GFF...

网友评论

    本文标题:VCF文件转化为注释BED文件

    本文链接:https://www.haomeiwen.com/subject/xfuezqtx.html