美文网首页
生信自学网单细胞测序(二)

生信自学网单细胞测序(二)

作者: cHarden13 | 来源:发表于2020-03-21 19:13 被阅读0次

    数据的过滤、标准化、聚类、注释
    这一部分主要是基于Seurat包和SingleR包进行
    输入文件为表达矩阵geneMatrix.txt

    1.读取文件

    将geneMatrix.txt读入R,同时判断矩阵中有无重复基因(即相同的第一列名),若有,则取平均值-使用limma里avereps()

    2.将矩阵转换为Seurat对象
    3.对数据进行过滤

    过滤分为两步,首先画小提琴图,根据小提琴图看需要设置的阈值是多少;然后使用subset()进行过滤。

    4.测序深度的相关性绘图
    5.数据进行归一化(normalizing)

    归一化目的为消除测序深度影响和消除表达量差异过大产生的影响。
    方法是将测序深度标准化为一个定值和取log。

    6.鉴定细胞间表达量差别大的基因
    7.数据标准化(scaling)

    ScaleData()

    8.聚类

    使用PCA法+tSNE法或ElbowPlot+UMAP法

    9.寻找差异表达的特征
    10.使用SingleR包注释细胞类型

    相关文章

      网友评论

          本文标题:生信自学网单细胞测序(二)

          本文链接:https://www.haomeiwen.com/subject/kbuuyhtx.html