学徒数据挖掘专场第二期
目录如下:
- 热图、韦恩图、GO富集分析图
- 纯R代码实现ssGSEA算法评估肿瘤免疫浸润程度
- 按基因在染色体上的顺序画差异甲基化热图
- 有生物学意义的复杂热图
- 干扰MYC-WWP1通路重新激活PTEN的抑癌活性——3步搞定GSEA分析
- TCGA正常血液样本中PD-L1与BRCA1和NBS1的表达量相关性
本次需要完成的是非主流转录组数据分析图表,主流图表是:
- 表达矩阵的质控及可视化(PCA图及箱线图)
- 3大R包,edgeR, DEseq2, limma 做差异分析
- 差异分析的质控及可视化(热图及火山图)
- 差异基因的GO/KEGG数据库注释
- 表达矩阵及基因列表的GSEA分析
背景知识:
以前通常认为乳腺上皮包括两大类细胞:位于内层的分泌性管腔细胞(secretory luminal cells)和位于外层的基底/肌上皮细胞(basal/myoepithelial cells)
- an inner layer of luminal cells that surround the lumen
- an outer layer of myoepithelial cells that lie in a basal position adjacent to the basement membrane.
发表于2017年9月的NC,文章是;Construction of developmental lineage relationships in the mouse mammary gland by single-cell RNA profiling 的研究者系统性的跟踪检测了小鼠epithelial cells 的各种时期的单细胞转录组情况,包括: pre-puberty, puberty, adulthood and pregnancy, as well as at different points of the estrus cycle.
而我们今天要复现图表的文章(Cell Rep. 2016 Nov 15;) 提到正常的成年人的mammary gland 是由双层上皮细胞组成:
- Bipotent and myoepithelial progenitors are prominent and unique components of the outer (basal) layer.
- The inner (luminal) layer includes both luminal-restricted progenitors and a phenotypically separable fraction that lacks progenitor activity.
简而言之,外层是basal,内层是luminal。其中luminal还可以细分成两类。作者就研究了这3类细胞,再加上 stromal cells, 总共4类细胞。
发表于2018年的《Nature Communications》 , 题目为“Profiling human breast epithelial cells using single cell RNA sequencing identifies cell diversity”。 作者从7个个体的乳腺上皮细胞提取25,790 个单细胞进行转录组测序。
鉴定出了三种不同的上皮细胞群:
- 1种基底细胞
- 2种管腔细胞,即L1型和L2型
- L1型是分泌细胞
- L2型在乳腺组织内扮演激素敏感元件功能。
网友评论