美文网首页
解析KEGG文件

解析KEGG文件

作者: 白云梦_7 | 来源:发表于2018-06-05 17:34 被阅读0次

    https://www.genome.jp/kegg-bin/get_htext?hsa00001+3101

    C开头的就是kegg的pathway的ID所在行,D开头的就是属于它的kegg的所有的基因

    perl -alne '{if(/^C/){/PATH:hsa(\d+)/;$kegg=$1}else{print "$kegg\t$F[1]" if /^D/ and $kegg;}}' hsa00001.keg >kegg2gene.txt

    ++++++++++++++++++++++++++++++++

    #!usr/bin/perluse warnings;use strict; my ($path, $num);open IN, 'hsa00001.keg';open OUT, '>kegg_sorting'; while (){

      chomp;

        if (/^C/){

            ($num)=$_=~/C\s*(\d+).*/;

            #print OUT"$num\n";

        }

        elsif(/^D/){

            ($path)=$_=~/D\s+(\d+).*/;

            print OUT "$num\t$path\n";

        }

    }

    相关文章

      网友评论

          本文标题:解析KEGG文件

          本文链接:https://www.haomeiwen.com/subject/fddmsftx.html