Cellranger软件是 10X genomics 官方提供的配套分析软件,可以直接输入Illumina 原始数据(raw basecall ,BCL)输出表达定量矩阵、降维(pca),聚类(Graph-based&K-Means)以及可视化(t-SNE)结果,结合配套的Loupe Cell Browser给予研究者更多探索单细胞数据的机会。cellranger的高度集成化,使得单细胞测序数据探索变得更加简单,研究者有更多的时间来做生物学意义的挖掘。
分析10X genomics的单细胞数据,第一步就是用cellranger软件对FASTQ测序数据进行分析。cellranger处理scRNA-seq数据的分析流程可以划为四步:拆分数据(mkfastq)、细胞定量(count)、定量整合(aggr)、数据下游分析(reanalysis)。但是目前,单细胞数据下游分析一般交给Seurat或Scanpy,因此cellranger的主要用途是使用测序数据(fastq)生成feature-barcode表达谱。接下来就为大家简单介绍cellranger软件的使用方法。
软件下载和安装
官方下载地址:https://support.10xgenomics.com/single-cell-gene-expression/software/downloads/latest
打开官方下载页面,注意箭头所指的下载版本,不同版本的cellranger分析出来的数据会有些微的差异,同一个项目的数据分析最好使用相同版本的软件。10X官方每次进行软件版本更新都会有非常详细的说明更新的要点,可以查看了解一下。箭头所指的网址为软件的下载网址,复制到linux系统命令界面就直接下载啦。因为单细胞数据都比较大,说以cellranger软件一般都在服务器上运行。

解压文件

首先testrun一下,看看能不能模拟跑下来

cellranger的功能
它主要包括四个主要基因表达分析流程:
1. cellranger mkfastq : 它借鉴了Illumina的bcl2fastq ,可以将一个或多个lane中的混样测序样本按照index标签生成样本对应的fastq文件。
2. cellranger count :利用mkfastq生成的fq文件,进行比对(基于STAR)、过滤、UMI计数。利用细胞的barcode生成gene-barcode矩阵,然后进行样本分群、基因表达分析。
3. cellranger aggr :接受cellranger count的输出数据,将同一组的不同测序样本的表达矩阵整合在一起,比如tumor组原来有4个样本,PBMC组有两个样本,现在可以使用aggr生成最后的tumor和PBMC两个矩阵,并且进行标准化去掉测序深度的影响。
4 .cellranger reanalyze :接受cellranger count或cellranger aggr生成的gene-barcode矩阵,使用不同的参数进行降维、聚类。
开始运行
这里主要介绍转录组数据的分析流程
首先,加载环境变量

1.细胞定量

重要参数

返回的文件

重要参数

2.定量整合
多个样本的合并分析:需要每个单独分析之后的molecule_info.h5文件,和一个CSV格式的表格,如下图所示:


重要参数

返回的文件

重要参数

到此,cellranger的标准流程就跑完了,后续个性化分析就可以用输出的矩阵文件,运用各种R包进行数据挖掘。
参考资料:Overview of Single Cell Software -Software -Single Cell Gene Expression -Official 10x Genomics Suppo
网友评论