![](https://img.haomeiwen.com/i14607083/0e270698b34fa629.png)
单细胞生信分析教程
单细胞生信分析教程并配有视频在线教程,目前整理出来的相关教程目录如下:
SCS【4】单细胞转录组数据可视化分析 (Seurat 4.0)
SCS【6】单细胞转录组之细胞类型自动注释 (SingleR)
SCS【7】单细胞转录组之轨迹分析 (Monocle 3) 聚类、分类和计数细胞
SCS【8】单细胞转录组之筛选标记基因 (Monocle 3)
SCS【9】单细胞转录组之构建细胞轨迹 (Monocle 3)
SCS【10】单细胞转录组之差异表达分析 (Monocle 3)
SCS【11】单细胞ATAC-seq 可视化分析 (Cicero)
SCS【12】单细胞转录组之评估不同单细胞亚群的分化潜能 (Cytotrace)
SCS【13】单细胞转录组之识别细胞对“基因集”的响应 (AUCell)
SCS【15】细胞交互:受体-配体及其相互作用的细胞通讯数据库 (CellPhoneDB)
SCS【16】从肿瘤单细胞RNA-Seq数据中推断拷贝数变化 (inferCNV)
SCS【17】从单细胞转录组推断肿瘤的CNV和亚克隆 (copyKAT)
临床预测模型教程
临床预测模型教程,临床预测模型教程整理如下:
Topic 10. 单因素 Logistic 回归分析—单因素分析表格
Topic 12 临床预测模型—列线表 (Nomogram)
Topic 13. 临床预测模型—一致性指数 (C-index)
Topic 14. 临床预测模型之校准曲线 (Calibration curve)
Topic 16. 临床预测模型之接收者操作特征曲线 (ROC)
Topic 19. 临床预测模型之输出每个患者列线图得分 (nomogramFormula)
Topic 20. 临床预测模型之竞争风险模型及计算生存概率
基于机器学习构建临床预测模型
MachineLearning 2. 因子分析(Factor Analysis)
MachineLearning 3. 聚类分析(Cluster Analysis)
MachineLearning 4. 癌症诊断方法之 K-邻近算法(KNN)
MachineLearning 5. 癌症诊断和分子分型方法之支持向量机(SVM)
MachineLearning 6. 癌症诊断机器学习之分类树(Classification Trees)
MachineLearning 7. 癌症诊断机器学习之回归树(Regression Trees)
MachineLearning 8. 癌症诊断机器学习之随机森林(Random Forest)
MachineLearning 9. 癌症诊断机器学习之梯度提升算法(Gradient Boosting)
MachineLearning 10. 癌症诊断机器学习之神经网络(Neural network)
MachineLearning 11. 机器学习之随机森林生存分析(randomForestSRC)
MachineLearning 12. 机器学习之降维方法t-SNE及可视化(Rtsne)
MachineLearning 13. 机器学习之降维方法UMAP及可视化 (umap)
![](https://img.haomeiwen.com/i14607083/a02a9961407d4460.png)
非小细胞肺癌(Non-small cell lung cancer, NSCLC)是世界上分布最广泛的肿瘤,其免疫治疗并不实用。中性粒细胞是肿瘤中数量最多的免疫细胞群之一。本研究旨在研究NSCLC肿瘤免疫微环境(TIME)中复杂的通讯网络,通过分析中性粒细胞分化特征,阐明免疫细胞与肿瘤之间的相互作用,建立预测患者免疫应答和预后的预后风险模型。使用来自NSCLC样本和Bulk RNA-seq的集成单细胞RNA测序(scRNA-seq)数据进行分析。确定了28个主要的细胞簇,并阐明了它们的相互作用。接下来,我们发现了四个不同分化状态的中性粒细胞亚群,它们与免疫调节和代谢途径密切相关。基于4个家庭管理基因(ACTB、GAPDH、TFRC、TUBB)的比值,通过Elastic Net和多元Cox回归构建6个中性粒细胞分化相关基因(NDRGs)的预后风险模型,包括MS4A7、CXCR2、CSRNP1、RETN、CD177和LUCAT1,在3个大队列中成功预测并验证患者的总生存时间和免疫治疗反应。最后,探索6种预后基因导致NSCLC预后不良的原因,筛选出针对预后基因抗肿瘤作用的小分子化合物。本研究明确了NSCLC中的TIME调控网络,强调了NDRGs在预测NSCLC患者预后及其对免疫治疗的潜在反应中的关键作用,为NSCLC提供了一个有前景的治疗靶点。
![](https://img.haomeiwen.com/i14607083/c8819b792e91bc65.png)
相关数据准备
数据集选择:
单细胞数据集:GSE131907数据集包含58例肺腺癌,GSE148071数据集包含42例NSCLC患者数据
Bulk转录组数据集:TCGA-LUAD, TCGA-LUSC, and GSE81089
基因集选择:中性粒细胞分化相关基因
生信分析方法:
我们从文章的分析流程中提取所有的分析内容,整理出来就 15个分析条目,每个条目都包括分析的内容,这些分析构成了整个文章,本文属于生信分析的文章,下面我们就看看哪些分析可以利用桓峰基因公众号的教程来实现,点击分析条码就会跳转到对应公众号的教程,跟着教程做,您也能发轻松发高分,如下:
3. 肿瘤组织和正常组织中细胞比例分析(CopyKAT);
4. 免疫检查点表达水平分析(CIBERSORT);
5. 细胞通讯分析(iTAKL);
6. 伪时间轨迹分析 (Monocle);
7. 不同状态下的细胞进行功能富集分析(GSEA);
8. 体细胞突变分析(maftools);
9. 多因素Cox回归方法构建预后风险模型;
10. 基因筛选Lasso回归;
11. 模型准确性评估 (ROC);
12. 生存分析(Kaplan-Meier)和构建列线图(nomogram);
13. 单样本免疫浸润分析(ssGSEA);
14. 基因集变异分析预后基因功能研究(GSVA);
15. 药物筛选对接(CTD,PubChem,Uniport,PyMol)。
研究结果
1. 通过降维和聚类获得细胞簇及其Marker
(A) 第一级分类后获得28个细胞簇;
(B) 通过标记基因注释鉴定10种细胞类型;
(C) 来自28种细胞类型的Marker基因表达水平的热图
(D) 淋巴样免疫细胞二级分类后得到14个细胞簇;
(E) 标记基因注释鉴定7种细胞类型;
(F) 髓系免疫细胞二级分类后得到15个细胞簇;
(G) 标记基因注释鉴定7种细胞类型;
(H) 从正常上皮细胞中经二次分类获得18个细胞簇;
(I) 然后通过标记基因注释鉴定9种细胞类型。
![](https://img.haomeiwen.com/i14607083/5649e11d821aac2b.png)
2. Bulk RNA-seq中28种细胞类型的丰度和scRNA-seq中的细胞相互作用网络
(A) 28个单元格类型被CIBERSORT注释到TCGA队列;
(B) 癌细胞与其他细胞相互作用的细胞通讯网络(iTALK)。
![](https://img.haomeiwen.com/i14607083/c179131c1c89beb8.png)
3. 中性粒细胞的伪时间分析和NDRGs的突变分析
(A) 根据中性粒细胞的伪时间;
(B) 将细胞群分为四种不同的分化状态;
(G) 通过分化状态的差异分析得到NDRGs ;
(C-F) GSVA 分析了四种不同的分化状态;
(H) NDRGs的前30%突变频率和突变类型;
(I) 及不同状态下NDRGs的突变情况.
![](https://img.haomeiwen.com/i14607083/960d53df852d1aad.png)
![](https://img.haomeiwen.com/i14607083/7d6cad12a6326b07.png)
4. 预后风险模型的构建与验证
(A) 差异基因;
(B) 与NDRGs的交集;
(C, D) 采用Elastic Net Regression算法筛选出8个具有预后特征的NDRG;
(E) 采用Multivariate Cox 确认6个预后风险模型基因;
(F) 训练集;
(G) 内部验证集;
(H) 外部验证集的风险评分分布、患者状态、mRNA表达热图、ROC曲线、KM生存曲线;
(I) 预后风险模型Nomogram;
(J) 预测1、3、5年生存率的nomogram校准曲线.
![](https://img.haomeiwen.com/i14607083/8392fc2f2e5b8cac.png)
5. 预后模型的免疫预测性能和临床预测能力
(A) 按照中位数分组风险评分后,检查高危组和低危组28个免疫细胞的丰度;
(B) 风险评分与28种免疫细胞丰度的Spearman相关性分析;
(C-H) 高危组和低危组患者年龄、性别、M期、N期、T期、分期分布情况;
(I) 单变量Cox回归;
(J) 多变量Cox回归分析TCGA队列的临床信息。
![](https://img.haomeiwen.com/i14607083/45e616052d5c7c04.png)
6. TCGA队列中6个预后基因的表达水平、生存分析和功能研究
(A) TCGA队列中6个预后基因的表达水平
(B-G) TCGA队列中6个预后基因 KM生存曲线;
将MS4A7 (H)、CXCR2 (I)、LUCAT1 (J)、CD177 (K)、CSRNP1 (L)和RETN (M)按高低水平分组后,对GSVA富集的KEGG和GO通路进行评分。
![](https://img.haomeiwen.com/i14607083/76c8314cd06a8e97.png)
![](https://img.haomeiwen.com/i14607083/9aaa29dc42ccbe49.png)
7. 预后基因编码蛋白与小分子化合物的对接结果
(A) MS4A7与雌二醇对接结果;
(B) CXCR2与海麻碱对接结果;
(C) RETN与离子霉素对接结果;
(D) CSRNP1与倍氯米松对接结果;
(E) CD177与XL147对接结果。
![](https://img.haomeiwen.com/i14607083/c6c86a56926a9b59.png)
References:
1. Pang J, Yu Q, Chen Y, Yuan H, Sheng M, Tang W. Integrating Single-cell RNA-seq to construct a Neutrophil prognostic model for predicting immune responses in non-small cell lung cancer. J Transl Med. 2022;20(1):531. Published 2022 Nov 18. doi:10.1186/s12967-022-03723-x
这篇文章利用桓峰基因公众号上的教程完全可以实现这些图表的绘制,过程需要自己细致的探究,毕竟不是很简单的分析,能发到8+也需要有一定的生信分析和结果解读的能力!
本文使用 文章同步助手 同步
网友评论