美文网首页单细胞测序
单细胞测序分析(一):上游分析

单细胞测序分析(一):上游分析

作者: 生信小白花 | 来源:发表于2022-05-10 20:22 被阅读0次

10x Genomics 单细胞测序分析 (Chromium)优势

探索组织中存在哪些细胞类型
识别未知/罕见的细胞类型或状态
阐明分化过程中或跨时间或状态的基因表达变化
识别特定细胞类型在不同条件(例如,治疗或疾病)之间差异表达的基因
探索在结合空间、调节和/或蛋白质信息的同时,细胞类型之间表达的变化

scRNA-seq分析的挑战

尽管scRNA-seq能够捕获细胞水平的表达,但样品制备和文库制备的成本更高,分析也更复杂,更难解释。scRNA-seq数据分析的复杂性包括:
数据量大
每个细胞的测序深度低
细胞/样本间的技术可变性
细胞/样本间的生物可变性

上游分析

  1. 通过测序公司得到最原始的测序数据,得到的原始数据命名应该是这种格式:AG-1_S1_L001_R1_001.fastq.gz,不然cell ranger软件不能识别。
  2. 使用cell ranger软件进行上游分析。因为需要很大的运算量,只能在linux系统或者服务器上操作。下载Cellranger,并解压,要注意版本的兼容性
  3. 添加Cell Ranger到.bashrc,这样下次登陆就不用再次export了,切换到家目录下, ,将下方这句添加到.bashrc文件中
    更新一下.bashrc文件。
tar –zxvf cellranger-4.0.0.tar
vi .bashrc
export PATH=~/download/cellranger-4.4.0
source .bashrc
  1. 下载该物种的转录本注释文件,并且解压
  2. 运行下面的程序
#!/bin/sh
yhrun -N 1 -n 1 -p work ../software/cellranger-4.0.0/cellranger count \
--id=AGM --fastqs=../rawdata \
--sample=AG-1,AG-2,AG-3,AG-4 \##样本名前缀HCC5F5-1_S1_L001_R1_001.fastq.gz  ,只写S1前面的前缀。

--transcriptome=../reference/refdata-gex-GRCh38-2020-A##注释文件解压后的文件夹

cellranger count 流程:其功能为将 cellranger mkfastq 产生的或其他来源的 FASTQ 文件进行比对、过滤、barcode 计数以及 UMI 计数,并可以生成 feature-barcode 定量矩阵,随后确定细胞群并进行基因表达分析。
Cell Ranger 中封装了比对软件 STAR,根据转录本的注释文件 GTF 中的注释信息,使用 STAR 来判断reads 是比对到了外显子、内含子还是基因间区上,或者说来判断 reads 是否比对到了基因组上。
当一条 read 至少要有 50% 碱基序列与基因组上的外显子碱基互补配对,认为其比对到了外显子上;若 reads 未比对上外显子但与内含子相交,则认为其比对到了内含子上;否则为比对到了基因间区。若 reads 比对到了一个单一的外显子位点,但同时比对到了一个或多个非外显子位点,则优先认为该 read 比对到了外显子位点,MAPQ 为 255。

  1. 得到一个outs文件夹,里面为分析结果,用于下游分析


    image.png

相关文章

网友评论

    本文标题:单细胞测序分析(一):上游分析

    本文链接:https://www.haomeiwen.com/subject/vzklurtx.html