跟着NC做基因组数据分析

作者: 小杜的生信筆記 | 来源:发表于2022-12-08 18:10 被阅读0次

本期内容为[跟着NC做基因组数据分析],这是你需要的教程,对你一定有帮助。

前言
今天花费找文章,看到一篇关于基因组,组装的文章,主要是里面的图吸引了我的关注。后面仔细一看,作者竟然提供了分析的代码流程,还是比较详细的。提供的代码,基本是可以满足大部分初学者的需求,作为初学者的你还不仔细看看呢??
原文



--
详细代码:



仅比对的流程就有6个,包括有参、无参比对

1-Genome analysis



Hista-samtools 流程

#!/bin/bash

genome=$1
index=${genome%.*}
rna_1_fq=`cat $2|grep 1P|sed ":a;N;s/\n/,/g;ta"` #1.fq path list
rna_2_fq=`cat $2|grep 2P|sed ":a;N;s/\n/,/g;ta"` #2.fq path list

#echo $index
hisat2-build -p 20 $genome $index

hisat2 -x $index \
           -1 $rna_1_fq\
           -2 $rna_2_fq\
           --threads 20 \
           --min-intronlen 20 \
           --max-intronlen 20000 \
           --dta \
           --score-min L,0.0,-0.4 \
           -S ${index}.sam


samtools sort -@ 20 \
                  -o ${index}.sorted.bam \
                      -O BAM \
                ${index}.sam

Trinty Denovo流程

#!/bin/bash

#conda activate trinity

export PATH="$PATH:/usr_storage/jcf/.conda/envs/trinity"

rna_1_fq="cat $1|sed ":a;N;s/\n/,/g;ta"" #1.fq path list 
rna_2_fq="cat $2|sed ":a;N;s/\n/,/g;ta"" #2.fq path list
bam="$3"  #sorted.bam from hisat
out=${bam%.*}


Trinity --left $rna_1_fq \
      --right $rna_2_fq \
    --seqType fq  \
    --max_memory 100G \
    --no_normalize_reads \
    --CPU 20 \
    --bflyCalculateCPU  \
    --output trinity_denovo_$out
    
Trinity --genome_guided_bam $bam  \
    --genome_guided_max_intron 10000 \
    --max_memory 100G \
    --no_normalize_reads \
    --CPU 20 \
    --bflyCalculateCPU\
    --output trinity_GG_$out

--

此外,还有Indel、SNP和SV的分析。

...........................
...........................
...........................



干活满满,就看你自己如何来学习。

--

获得代码,请回复正确的关键词!!



--

欢迎大家关注我的公众号!!

往期文章(总汇)


小杜的生信筆記 ,主要发表或收录生物信息学的教程,以及基于R的分析和可视化(包括数据分析,图形绘制等);分享感兴趣的文献和学习资料!

相关文章

  • 跟着NC做基因组数据分析

    本期内容为[跟着NC做基因组数据分析],这是你需要的教程,对你一定有帮助。 前言今天花费找文章,看到一篇关于基因组...

  • 2019-04-19

    再分析数据历史资料: goal:历史年平均与月平均 方式1:通过已有数据,通过ncl_convert2nc, nc...

  • [跟着NC学作图]--生存分析(Survival analysi

    本期内容为[跟着NC学作图]--生存分析(Survival analysis) 生存分析是人类癌症分析中常用到的分...

  • 使用anvi'o 进行微生物pangenomics泛基因

    1.数据下载 2.数据解压 2.泛基因组数据库的构建 泛基因组分析 后面还可以对其泛基因组功能进行分析,感兴趣的大...

  • [Metagenome-1] Metagenomic Data

    宏基因组数据分析 宏基因组,和metataxonomics(16s rRNA analysis),是使用全基因组测...

  • GATK分析

    从零开始完整学习全基因组测序(WGS)数据分析:第1节 测序技术 从零开始完整学习全基因组测序(WGS)数据分析:...

  • 人类全基因组基本分析

    参考生信技能树直播我的基因组中的分析,学习人类全基因组基本分析流程 1、数据准备 1.1 练习数据下载 学习所用的...

  • 「杂谈」Nanopore组装的拟南芥基因组效果如何?

    使用的数据来自于一篇发在NC的拟南芥的基因组文章,文章用了minimap/miniasm 进行组装,然后用raco...

  • 分析流程

    基因组重测序数据目的:需要检测基因组中的变异,找到并定位这些突变位点 条件:参考基因组、重测序数据、 分析流程: ...

  • 为什么宏基因组数据分析比较难?

    生物数据分析包括很多种类,比如人基因组,植物,动物,微生物,还有RNA,单细胞RNA等等,其中宏基因组数据分析是比...

网友评论

    本文标题:跟着NC做基因组数据分析

    本文链接:https://www.haomeiwen.com/subject/exanfdtx.html