数据的过滤、标准化、聚类、注释
这一部分主要是基于Seurat包和SingleR包进行
输入文件为表达矩阵geneMatrix.txt
1.读取文件
将geneMatrix.txt读入R,同时判断矩阵中有无重复基因(即相同的第一列名),若有,则取平均值-使用limma里avereps()
2.将矩阵转换为Seurat对象
3.对数据进行过滤
过滤分为两步,首先画小提琴图,根据小提琴图看需要设置的阈值是多少;然后使用subset()进行过滤。
4.测序深度的相关性绘图
5.数据进行归一化(normalizing)
归一化目的为消除测序深度影响和消除表达量差异过大产生的影响。
方法是将测序深度标准化为一个定值和取log。
6.鉴定细胞间表达量差别大的基因
7.数据标准化(scaling)
ScaleData()
8.聚类
使用PCA法+tSNE法或ElbowPlot+UMAP法
网友评论