1. 文件配置(mapfile+run.sh)
1.1 配置mapfile
#rna_fastq_ID rna_datapath rna_sample_name
LC211013006X1 /fastqs/rna_dir sample1
LC211013006X2 /fastqs/rna_dir sample1
LC211013007X1 /fastqs/rna_dir sample2
# 第一列 rna_fastq_ID:对应fastq文件的名称前缀
# 第二列 rna_datapath:对应fastq文件的路径
# 第三列 rna_sample_name:对应质控报告的名称
# example:这里的sample1对应两个文库数据(LC211013006X1+LC211013006X2),如此记录可以完成整合分析
fastq文件示例:
- 生成name为 “sample1”的质控报告:LC211013006X1、LC211013006X2对应 “sample1” 的测序数据
-
生成name为“sample2”的质控报告:LC211013007X1 对应 “sample2” 的测序数据
fastq文件
1.2 编辑运行脚本run.sh
multi_rna \
--mapfile ./mapfile\
--genomeDir ./ensembl_99\ #参考基因组的路径
--outdir .\ #输出到当前文件夹
--thread 8 #配置线程数
--starMem 30\ #配置star所需内存
--mod shell\ #这里通过shell脚本的方式运行
--gzip #生成的clean_reads为 fq.gz 形式
2. 生成“命令文件”
(1)激活celescope的环境conda activate celescope
(2)运行run.sh sh run.sh
很快运行完成,主要生成一个shell文件夹,其中会有一个以sample1命名的shell脚本
sample1.sh
的每行指令:对应每一步分析(质控报告的每一部分数据)
3. 投递“命令文件”
sh sample1.sh
最终生成如下一系列数据和最终的html质控报告
postscripts:github详细的指导链接点击这里
网友评论