PsctH
Plant Single Cell Transcriptome Hub
2022
Plant Biotechnology Journal
Plant Single Cell Transcriptome Hub (PsctH): an integrated online tool to explore the plant single-cell transcriptome landscape
Fig 1a
目前,在植物中仍缺乏有效的marker基因数据库,给植物单细胞研究带来了很大的不便。
为了解决这个问题,作者基于Shiny和bootstrap框架开发了PsctH网站(Fig 1a),旨在为植物的各种细胞类型提供全面且准确的marker基因资源和在线工具。
Fig 1b-d
所有的marker基因都经过RNA原位杂交或GFP reporter 所验证,为此作者收集了20多篇植物单细胞文章的marker基因,包括5个物种(拟南芥、玉米、水稻、花生和番茄)(Fig 1b-d)。
叶片、皮层、侧根原基、根的韧皮部、花序分生组织以及雄性原基的小穗分生组织有超过两个以上的marker基因。大多数marker基因来自根部,涉及26种细胞类型,最丰富的根部细胞类型是侧根原基细胞。
Fig 1e
所有marker基因都在“MarkerGeneDB”页面上显示,并可以通过关键词进行搜索(Fig 1e)。所有marker基因的信息都可以以Tab分隔的文件下载。
Fig 1f
除了细胞的marker基因,在植物单细胞测序中另一个挑战是制备完整且有活力的单细胞悬浮液。制备植物单细胞悬浮液的第一步通常是从纤维素酶和半纤维素酶消化细胞壁开始。
在PsctH中,作者比较和评估了用于制备原生质体的不同方案,并提供了一个可行且高效的实验流程,包括组织样品的制备和分离、酶消化、纯化以及单细胞完整性检测(Fig 1f)。
Fig 1g
为了使植物scRNA-seq分析过程更加规范化,作者还提供了植物scRNA-seq分析的pipeline,包括质控、标准化、聚类和鉴定marker基因(Fig 1g)。
用户可以通过设置合适的关键参数来调用内置的R脚本。此外,作者还提供了相应的环境,可以方便的通过conda搭建单细胞分析环境。
PCMDB
Plant Cell Marker Database
2021
Nucleic Acids Research
PCMDB: a curated and comprehensive resource of plant cell markers
背景
Marker基因是在一种细胞类型中高表达,在其他类型中低表达或不表达的基因。这些marker分散在成千上万篇文献中,很难收集和整理。在动物中已经有类似的数据库对marker基因进行整理,但是植物种比较缺乏,有的仅仅是针对单一物种,如水稻、拟南芥的marker基因数据库,因此开发植物多物种的综合性marker基因数据库十分重要。
作者认为像PlantscRNAdb那样仅通过关键词“marker(s)”和“specific expression’”搜索容易造成遗漏。因此作者开发了PCMDB,发表这篇文章时,该数据库包含6个植物物种的81,117个人工筛选的marker基因,其中3,119被实验验证,这些marker基因涉及了22个组织的263种细胞类型。
PCMDB数据构成及处理
PCMDB包含六种模式植物(拟南芥、水稻、玉米、大豆、番茄和烟草),marker基因分成三类:通过实验验证的marker基因、基于bulkRNA-seq确定的marker基因、基因scRNA-seq确定的marker基因。尽管bulkRNA-seq的研究不局限于特定的细胞类型,但是这些数据可以对另外两种方法进行补充。为了保证组织和细胞类型鉴定的规范化,作者将组织和细胞名称统一为一个基于Plant Ontology数据库的标准命名。
作者通过以下三种策略来收集整理已发表的marker基因:
(1)作者使用了Plant Ontology种的细胞名称通过pubmed进行搜索,共获得123,490篇文献,其中拟南芥31,967篇,水稻17,945篇,玉米16,552篇,大豆11,593篇,番茄10,150篇,烟草37,283篇。通过对这些文章的摘要进行人工筛选以去除不相关文献。然后检测全文,保留包含细胞marker的文章。同时,利用每个植物的eFP浏览器进一步检查这些候选植物的表达模式。通过以上操作,获得2883篇拟南芥参考文献,996篇水稻参考文献,649篇玉米参考文献,336篇大豆参考文献,277篇番茄参考文献和272篇烟草参考文献。
(2)考虑到单细胞测序对发掘细胞marker基因的贡献,作者通过Pubmed检索了"single cell", "single cell sequencing", "single cell RNA sequencing", "single cell RNA-seq", "single cell RNA seq", "single cell transcriptome", ‘single cell transcriptomics’ 和 ‘scRNA seq’等关键词,通过这种方法共获取了参考文献,包括14篇拟南芥,3篇水稻,3篇玉米和1篇番茄。
(3)作者还利用‘genome wide/genome-wide’, ‘transcriptome’, ‘landscape’ 和 ‘global’等关键词了搜索bulkRNA-seq文献,共获得11,011篇拟南芥、3,169篇水稻、1,593篇玉米,1,821篇大豆,609篇番茄和1,727篇烟草,手动检查了这些文章鉴定到的marker基因。
Fig 1
发表文章时的版本包含了81,117哥marker基因,其中拟南芥19,260个,水稻19,359个,玉米16,828个,大豆12,357个,番茄12,198个,烟草1,115个。其中由3119marker基因被实验验证,包括GFP、GUS和western blotting (Fig 1)。
PCMDB特点
Fig 2d
PCMDB整理了marker基因的所有基本信息,如核苷酸序列、氨基酸序列、基因组位置和功能注释。此外,用户可以使用eFP浏览器找到不同的marker基因的组织特异性和细胞类型特异性表达模式(Fig 2d)。
Fig 2e-f
这些表达量信息可以通过柱状图进行简易的展示(Fig 2e)。PCMDB还可以对每一份scRNA-seq数据直接生成细胞类型的聚类图(Fig 2f)。
Fig 3a
Fig 3b-c
此外,为了满足scRNA-seq分析中对细胞类型进行个性化注释的需求,PCMDB还支持一些额外的工具,如基于marker预测细胞类型(SCSA,Fig 3a),基于参考数据预测细胞类型(SingleR,Fig 3b)。
为了弥补PCMDB中其他植物物种的缺失,该网站还支持基于同源性进行marker预测,以在不同物种中根据同源鉴定marker基因(Fig 3c)
作者页提供的“submit”选项,用来补充新发现的marker基因。
本文使用 文章同步助手 同步
网友评论