美文网首页
利用scanpy进行数据归一化

利用scanpy进行数据归一化

作者: 生信阿拉丁 | 来源:发表于2021-10-30 17:36 被阅读0次

作者:童蒙
编辑:angelica

函数1—scanpy.pp.regress_out

01 功能

去除非期望来源的方差对数据的影响。使用的是简单的线性回归模型,同seurat的regressOut类似,然而,在某些情况下需要注意,可以参见:https://github.com/theislab/scanpy/issues/526

对于不同的数据,可能效果不一样,需要仔细分辨。比如下图第一行的,经过regress_out后,PC2已经降低了很多;而对于第二行的数据,由于包含了各种细胞类型,不管PC1还是PC2都同检测的基因数有关,因此取出后,感觉更怪异了。

对于细胞周期,第三行很好地分开G1 和 G2 M/S期,而第四行却不行,可能跟细胞类型多有关。

因此在使用这个函数的时候需要注意,regress_out会去除方差,然而通常去除的MT表达量或者细胞周期都是生物方差,而不是技术方差。去除生物方差的时候,可能会对其他的过程有影响,会误伤到我们想关注的因素。也许在做轨迹推断有帮助,但是在聚类的时候会有干扰。例如细胞的分裂周期可能跟细胞类型有关(不同的细胞类型也许会处于不同的细胞周期,比如干细胞和增值细胞),MT的表达可能跟某些生理因素相关,因此在去除的时候需要注意。

02 参数

  • adata:AnnData
  • keys:选择的obs中的key

03 例子

sc.pp.regress_out(adata, ['total_counts', 'pct_counts_mt'])

04 代码片段

利用Gaussian来去除方差,y为表达量,x为选择的obs;并且获得分析后的残差,修改y, 即adata.X

result = sm.GLM(
    data_chunk[:, col_index], regres, family=sm.families.Gaussian()
).fit()
new_column = result.resid_response

函数2—scanpy.pp.scale

将数据归一化到mean=0,var=1。

如果某个基因没有任何方差,也会被保留,如果设置了zero_center=True,那么会设置为0 ,未来会设置为NaN。否则会丢掉这个基因。

Variables (genes) that do not display any variation (are constant across all observations) are retained and (for zero_center==True) set to 0 during this operation. In the future, they might be set to NaNs.

参考资料

相关文章

  • 利用scanpy进行数据归一化

    作者:童蒙编辑:angelica 函数1—scanpy.pp.regress_out 01 功能 去除非期望来源的...

  • 一文做会漂亮的火山图

    一、通过limma包对输入数据进行处理 1、归一化处理 在利用limma包进行差异分析处理之前,要对数据进行归一化...

  • z-score归一化

    用途 对输入数据进行归一化处理 公式 其中σ为数据标准差(划重点,不是方差),μ为样本平均值。对数据进行归一化后,...

  • scanpy的空间转录组学数据的分析和可视化

    本教程演示了如何使用Scanpy处理空间转录组学数据。scanpy分析空间转录组数据[https://scanpy...

  • PCA主成分分析

    基本步骤: 对数据进行归一化处理 xi = xi-1/m(sum(xi)) 计算归一化后的数据集的协方差矩阵 x...

  • 归一化、标准化和正则化及代码实现

    归一化、标准化和正则化都是对数据进行处理的,那么这三种有什么区别呢? 归一化(normalization) 归一化...

  • 4.7 数据归一化

    数据归一化 Feature Scaling 首先我们开看一下为什么要进行数据归一化。我们使用前边说道的肿瘤的例子:...

  • 2020-08-19 炼丹经验

    1. 如果搭网络目标是做预测(或回归),训练时,不仅需要对训练数据归一化,而且要对验证数据进行归一化。在评价预测结...

  • 数据归一化 Feature Scaling

    数据归一化 最值归一化 均值方差归一化

  • 数据归一化

    什么是数据归一化 ? 具体有哪些归一化 ? 为什么要归一化 ? 1. 什么是数据归一化 ? standardize...

网友评论

      本文标题:利用scanpy进行数据归一化

      本文链接:https://www.haomeiwen.com/subject/irngaltx.html