摘要:本文记录了在Win10系统在Rstudio平台中使用 reticulate 为 Seurat::FindClusters
链接Python 环境下的 Leidenalg 算法进行聚类的实现过程 ,并探讨了在Seurat和Scanpy流程框架下,Louvain和Leiden算法在处理10万细胞样本量的表达谱矩阵时的速度表现。结果表明,尽管Leiden算法声称具有比Louvain算法更快的计算速度(宣称的速度优势),但实际上在大型数据集的处理速度上,Louvain算法却表现出了明显的优势,领先Leiden算法几倍的时间。
1、在Win10 系统中通过Conda配置Python环境
Anaconda 是一个流行的Python和R编程环境管理器,用于数据科学和机器学习领域。它提供了一个方便的方式来安装、管理和更新Python和R的包和库,同时也包含了一个强大的包管理工具Conda。
-
第一步,下载并安装Annconda软件 Free Download | Anaconda
conda channel 是存储conda 软件包的仓库,它可以让用户访问并安装各种不同的软件包。因此在按照上Conda之后,可以根据网络需求来进一步 配置conda channel(参考);
-
第二步,集成 Anaconda Prompt 到Windows Terminal
① Anaconda Prompt 是 Anaconda 发行版中为 Windows 操作系统 提供的一个命令行界面工具,用户可以执行诸如创建、激活、删除 Python 虚拟环境、安装、更新 Python 包等一系列与 Python 开发相关的操作。
② Windows Terminal(Windows 终端)是微软推出的一个终端仿真程序,它提供了一个集成的环境,用户可以在其中同时访问 PowerShell、WSL等系列命令行工具。
Windows Terminal 支持分屏、自定义配色、标签页管理等功能,为开发者提供了更便捷、更灵活的命令行环境。因此,将 Anaconda Prompt 集成到 Windows Terminal 一定程度上有助于提高开发者的工作效率和体验,使他们能够在一个统一的界面下轻松管理和操作不同的命令行工具。我们可以参考如下教程 【Incorporating an Anaconda Prompt to a Windows Terminal①】 和 【集成Anaconda Prompt 到 Windows Terminal②】。
集成之后的效果
参考 Windows Terminal config.json 字段:
**参考 Windows Terminal config.json 字段**
{
"colorScheme": "Tango Dark",
"commandline": "cmd.exe /K C:\Users\<user_name>\anaconda3\Scripts\activate.bat,
"cursorShape": "filledBox",
"experimental.retroTerminalEffect": false,
"guid": "{XXXX-XXXX}",
"hidden": false,
"icon": "C:\Users\<user_name>\anaconda3\Menu\anaconda-navigator.ico",
"name": "Anaconda Prompt",
"scrollbarState": "hidden",
"startingDirectory": "%USERPROFILE%",
"useAcrylic": true
},
-
第三步,在Conda中创建环境和安装Scanpy系列软件
Scanpy 是一个功能强大的Python库,专注于单细胞RNA测序数据的处理和分析。它提供了丰富的功能,包括数据预处理、细胞群聚、细胞亚型标记、差异基因分析等,同时支持可视化展示,使用户能够深入理解单个细胞的功能和表达模式。Scanpy的灵活性和整合性使其成为单细胞生物学研究中不可或缺的工具之一,帮助研究人员揭示细胞群体的多样性和调控机制。
conda create -n scRNA python=3.9
conda activate scRAN
conda install -c conda-forge scanpy python-igraph leidenalg
pip install scanpy
网友评论