美文网首页
植物测序数据rRNA污染清理

植物测序数据rRNA污染清理

作者: FengSL | 来源:发表于2021-01-26 14:46 被阅读0次

    由于实验技术或操作原因,有些高通量测序数据中存在大量的rRNA污染,评估和去除rRNA是后续分析的基础。

    首先 到核糖体RNA数据库 silva(high quality ribosomal RNA databases)下载rRNA序列。
    选择下载下面两个文件:

    SILVA_138.1_LSUParc_tax_silva_trunc.fasta.gz  ## Large subunit (23S/28S ribosomal RNAs)
    SILVA_138.1_SSUParc_tax_silva_trunc.fasta.gz ## Small subunit (16S/18S ribosomal RNAs)
    
    

    解压以后使用下面的命令提取泛植物 rRNA

    cat *.fasta|perl -ne 'BEGIN{$id=q{};$seq=q{}}chomp;if(/^>/){print $id,qq{\n},$seq,qq{\n} if ($id=~/Eukaryota;Archaeplastida/);$id=$_;$seq=q{}}else{$seq.=$_;}END{print $id,qq{\n},$seq,qq{\n} if ($id=~/Eukaryota;Archaeplastida/)}'|perl -pe 'tr/U/T/ unless /^>/' > panPlant.rRNA.fa
    

    相关文章

      网友评论

          本文标题:植物测序数据rRNA污染清理

          本文链接:https://www.haomeiwen.com/subject/mjqgzktx.html