单细胞免疫组库研究在实验过程中会构建一个转录组文库和一个免疫受体富集文库,因此数据分析也就分为两个环节:
(1) 单细胞转录组分析
(2) 单细胞免疫受体分析
本篇文章内只介绍 单细胞免疫受体数据分析 ,而celescope分析单细胞转录组数据的教程链接 点击这里。
1. vdj 文件配置(mapfile+run.sh)
1.1 配置mapfile
#vdj_fastq_ID vdj_datapath vdj_sample_name rna_sample_analysis_Path
R211013006X1 /fastqs/vdj_dir vdj_1 /xxx/sample1/06.analysis
R211013007X1 /fastqs/vdj_dir vdj_2 /xxx/sample2/06.analysis
# 第一列 vdj_fastq_ID:对应 vdj_fastq文件的名称前缀
# 第二列 vdj_datapath:对应 vdj_fastq文件的路径
# 第三列 vdj_sample_name:对应质控报告的名称
# 第四列:对应与其“配对的”单细胞转录组分析 “06.analysis” 路径
以下附图单细胞转录组分析目录:
单细胞转录组分析目录
1.2 编辑运行脚本run.sh
multi_vdj \
--mapfile ./mapfile\
--chemistry auto\
--outdir .\ #输出到当前文件夹
--type TCR\ #可以输入TCR 或 BCR
--gzip #生成的clean_data为 fq.gz 形式
# 如果增加参数“--not_consensus”,分析过程中将不会生成consensus相关目录
2. 生成“命令文件”
(1)激活celescope的环境conda activate celescope
(2)运行run.sh sh run.sh
很快运行完成,主要生成一个shell文件夹,其中会有一个以vdj_1命名的shell脚本
vdj_1.sh
的每行指令:对应每一步分析(质控报告的每一部分数据)
3. 投递“命令文件”
sh vdj_1.sh
运行方式和转录组类似
运行获得的文件夹:
postscripts: github详细的指导链接点击这里
网友评论