2023-01-04普通转录组-1_salmon
作者:
森尼啊 | 来源:发表于
2023-01-04 10:13 被阅读0次##主要参考教程
#https://www.jianshu.com/p/f6c9482f8927
conda search salmon #查看最新版本
conda install -y salmon=1.9.0 #最新版本
salmon -v #查看版本
conda install -c bioconda gffread
##建立index,参考
cd ref/hum_GRCH38
wget ftp://ftp.ensembl.org/pub/release-100/gtf/homo_sapiens/Homo_sapiens.GRCh38.100.gtf.gz -O GRCh38.gtf.gz
wget ftp://ftp.ensembl.org/pub/release-100/fasta/homo_sapiens/dna/Homo_sapiens.GRCh38.dna.primary_assembly.fa.gz -O GRCh38.fa.gz
gunzip -c GRCh38.fa.gz >GRCh38.fa
gunzip -c GRCh38.gtf.gz >GRCh38.gtf
# 获取cDNA序列
gffread GRCh38.gtf -g GRCh38.fa -w GRCh38.transcript.fa.tmp
# gffread生成的fasta文件同时包含基因名字和转录本名字
grep '>' GRCh38.transcript.fa.tmp | head
# 去掉空格后面的字符串,保证cDNA文件中fasta序列的名字简洁,不然后续会出错
cut -f 1 -d ' ' GRCh38.transcript.fa.tmp >GRCh38.transcript.fa
# 获取所有基因组序列的名字存储于decoy中
grep '^>' GRCh38.fa | cut -d ' ' -f 1 | sed 's/^>//g' >GRCh38.decoys.txt
# 合并cDNA和基因组序列一起
# 注意:cDNA在前,基因组在后
cat GRCh38.transcript.fa GRCh38.fa >GRCh38_trans_genome.fa
# 构建索引 (更慢,结果会更准)
salmon index -t GRCh38_trans_genome.fa -d GRCh38.decoys.txt -i GRCh38.salmon_sa_index
## 定量
cat SRR_Acc_List.txt | while read line
do
salmon quant -i /mnt/f/index/salmon_index/homo -l IU \
-1 ./1-cleandata/$line\_clean_1.fastq.gz -2 ./1-cleandata/$line\_clean_2.fastq.gz \
--validateMappings --gcBias --seqBias \
-g /mnt/f/reference/homo/Homo_sapiens.GRCh38.104.gtf -o ./3-salmon/$line
done
## 注意-l 参数,双端非特异性的,-l IU
##不清楚可用-l A或者--libType A
本文标题:2023-01-04普通转录组-1_salmon
本文链接:https://www.haomeiwen.com/subject/alurcdtx.html
网友评论