跟着NC做基因组数据分析

作者: 小杜的生信筆記 | 来源:发表于2022-12-08 18:10 被阅读0次

    本期内容为[跟着NC做基因组数据分析],这是你需要的教程,对你一定有帮助。

    前言
    今天花费找文章,看到一篇关于基因组,组装的文章,主要是里面的图吸引了我的关注。后面仔细一看,作者竟然提供了分析的代码流程,还是比较详细的。提供的代码,基本是可以满足大部分初学者的需求,作为初学者的你还不仔细看看呢??
    原文



    --
    详细代码:



    仅比对的流程就有6个,包括有参、无参比对

    1-Genome analysis



    Hista-samtools 流程

    #!/bin/bash
    
    genome=$1
    index=${genome%.*}
    rna_1_fq=`cat $2|grep 1P|sed ":a;N;s/\n/,/g;ta"` #1.fq path list
    rna_2_fq=`cat $2|grep 2P|sed ":a;N;s/\n/,/g;ta"` #2.fq path list
    
    #echo $index
    hisat2-build -p 20 $genome $index
    
    hisat2 -x $index \
               -1 $rna_1_fq\
               -2 $rna_2_fq\
               --threads 20 \
               --min-intronlen 20 \
               --max-intronlen 20000 \
               --dta \
               --score-min L,0.0,-0.4 \
               -S ${index}.sam
    
    
    samtools sort -@ 20 \
                      -o ${index}.sorted.bam \
                          -O BAM \
                    ${index}.sam
    

    Trinty Denovo流程

    #!/bin/bash
    
    #conda activate trinity
    
    export PATH="$PATH:/usr_storage/jcf/.conda/envs/trinity"
    
    rna_1_fq="cat $1|sed ":a;N;s/\n/,/g;ta"" #1.fq path list 
    rna_2_fq="cat $2|sed ":a;N;s/\n/,/g;ta"" #2.fq path list
    bam="$3"  #sorted.bam from hisat
    out=${bam%.*}
    
    
    Trinity --left $rna_1_fq \
          --right $rna_2_fq \
        --seqType fq  \
        --max_memory 100G \
        --no_normalize_reads \
        --CPU 20 \
        --bflyCalculateCPU  \
        --output trinity_denovo_$out
        
    Trinity --genome_guided_bam $bam  \
        --genome_guided_max_intron 10000 \
        --max_memory 100G \
        --no_normalize_reads \
        --CPU 20 \
        --bflyCalculateCPU\
        --output trinity_GG_$out
    

    --

    此外,还有Indel、SNP和SV的分析。

    ...........................
    ...........................
    ...........................



    干活满满,就看你自己如何来学习。

    --

    获得代码,请回复正确的关键词!!



    --

    欢迎大家关注我的公众号!!

    往期文章(总汇)


    小杜的生信筆記 ,主要发表或收录生物信息学的教程,以及基于R的分析和可视化(包括数据分析,图形绘制等);分享感兴趣的文献和学习资料!

    相关文章

      网友评论

        本文标题:跟着NC做基因组数据分析

        本文链接:https://www.haomeiwen.com/subject/exanfdtx.html