10x Genomics 单细胞测序分析 (Chromium)优势
探索组织中存在哪些细胞类型
识别未知/罕见的细胞类型或状态
阐明分化过程中或跨时间或状态的基因表达变化
识别特定细胞类型在不同条件(例如,治疗或疾病)之间差异表达的基因
探索在结合空间、调节和/或蛋白质信息的同时,细胞类型之间表达的变化
scRNA-seq分析的挑战
尽管scRNA-seq能够捕获细胞水平的表达,但样品制备和文库制备的成本更高,分析也更复杂,更难解释。scRNA-seq数据分析的复杂性包括:
数据量大
每个细胞的测序深度低
细胞/样本间的技术可变性
细胞/样本间的生物可变性
上游分析
- 通过测序公司得到最原始的测序数据,得到的原始数据命名应该是这种格式:AG-1_S1_L001_R1_001.fastq.gz,不然cell ranger软件不能识别。
- 使用cell ranger软件进行上游分析。因为需要很大的运算量,只能在linux系统或者服务器上操作。下载Cellranger,并解压,要注意版本的兼容性
- 添加Cell Ranger到.bashrc,这样下次登陆就不用再次export了,切换到家目录下, ,将下方这句添加到.bashrc文件中
更新一下.bashrc文件。
tar –zxvf cellranger-4.0.0.tar
vi .bashrc
export PATH=~/download/cellranger-4.4.0
source .bashrc
- 下载该物种的转录本注释文件,并且解压
- 运行下面的程序
#!/bin/sh
yhrun -N 1 -n 1 -p work ../software/cellranger-4.0.0/cellranger count \
--id=AGM --fastqs=../rawdata \
--sample=AG-1,AG-2,AG-3,AG-4 \##样本名前缀HCC5F5-1_S1_L001_R1_001.fastq.gz ,只写S1前面的前缀。
--transcriptome=../reference/refdata-gex-GRCh38-2020-A##注释文件解压后的文件夹
cellranger count 流程:其功能为将 cellranger mkfastq 产生的或其他来源的 FASTQ 文件进行比对、过滤、barcode 计数以及 UMI 计数,并可以生成 feature-barcode 定量矩阵,随后确定细胞群并进行基因表达分析。
Cell Ranger 中封装了比对软件 STAR,根据转录本的注释文件 GTF 中的注释信息,使用 STAR 来判断reads 是比对到了外显子、内含子还是基因间区上,或者说来判断 reads 是否比对到了基因组上。
当一条 read 至少要有 50% 碱基序列与基因组上的外显子碱基互补配对,认为其比对到了外显子上;若 reads 未比对上外显子但与内含子相交,则认为其比对到了内含子上;否则为比对到了基因间区。若 reads 比对到了一个单一的外显子位点,但同时比对到了一个或多个非外显子位点,则优先认为该 read 比对到了外显子位点,MAPQ 为 255。
-
得到一个outs文件夹,里面为分析结果,用于下游分析
image.png
网友评论