R小盐准备介绍那些小众又好用的生信数据库
你想要的R语言学习资料都在这里,快来收藏关注【科研私家菜】
今天R小盐介绍的数据库是opencell数据库 https://opencell.czbiohub.org/

01 opencell数据库
opencell数据库提供了蛋白质组尺度测量人类蛋白质定位和相互作用,通过亚细胞定位来探索所有标记的蛋白质。
Proteome-scale measurements of human protein localization and interactions,Explore all tagged proteins by subcellular localization.

opencell数据库提供了1310个标记蛋白质或目标的显微镜图像和蛋白质相互作用的交互式可视化。每个被标记的蛋白质都有一个专门的页面,称为“目标页面”,它显示所有的元数据、显微镜图像以及与被标记的蛋白质相关的蛋白质-蛋白质相互作用。对于人类蛋白质组中的每一种蛋白质,都有一个单独的专用页面,显示我们为OpenCell项目收集的数据(如果有的话)。
This website provides interactive visualizations of the microscopy images and protein interactions for all 1,310 tagged proteins, or targets, in the OpenCell library. Each of the tagged proteins has a dedicated page, called the "target page," that displays all of the metadata, microscopy images, and protein-protein interactions associated with the tagged protein. There is also a separate dedicated page for each protein in the human proteome that displays the data, if any, that we have collected for that protein as part of the OpenCell project.
OpenCell 是人类细胞中蛋白质定位和相互作用测量的蛋白质组规模集合。 它建立在包含 1,310 个内源性标记的 HEK293T 细胞系的库之上,使我们能够在相同的细胞环境中观察蛋白质定位(使用活细胞荧光显微镜)和蛋白质-蛋白质相互作用(使用 IP-MS)。
该项目是 Chan Zuckerberg Biohub 的 Leonetti 实验室和 Max Plank 生物化学研究所的 Mann 实验室以及许多其他合作者之间的合作。


OpenCell 中荧光标记的 HEK293T 细胞系是通过使用基于 mNeonGreen2 的分裂荧光蛋白系统标记人类基因构建的(Feng 等人,2017 年)。 FP 插入位点(N 或 C 末端)是根据来自文献或结构分析的信息选择的。 对于每个标记的目标,我们分离了一个 CRISPR 编辑的细胞的多克隆池,然后通过活细胞三维 (3D) 共聚焦显微镜、IP-MS 和通过下一代测序对标记的等位基因进行基因分型对其进行表征。
OpenCell 总共标记了 1,757 个基因,其中 1,310 个 (75%) 可以通过荧光显微镜检测并构成本网站上显示的数据的基础。 1,310 种蛋白质集合是人类蛋白质组的平衡表示,但线粒体、细胞器腔或细胞外基质特有的蛋白质除外,这些蛋白质无法使用我们当前的分离 FP 系统访问。
为了最大限度地提高通量,我们使用多克隆策略通过 FACS 选择基因组编辑的细胞。 这种方法产生了包含具有不同基因型的细胞的多克隆池。 包含 1,310 个标记细胞系的文库中位数为 61% 的 mNeonGreen 整合等位基因、5% 的野生型和 26% 的非功能性等位基因。 由于非功能性等位基因不支持荧光,因此它们不太可能对其他测量产生影响,尤其是在多克隆群体的背景下。
对于必需基因,荧光标记很容易成功,这表明 FP 融合具有良好的耐受性。 为了验证我们的方法不会干扰内源性表达水平,我们使用对 12 条标记线中靶向的蛋白质特异的抗体和 63 条标记线中的单次质谱法通过蛋白质印迹来量化蛋白质表达。 这两种方法都揭示了工程线中标记目标的中值丰度,约为未标记 HEK293T 对照的 80%。 在所有标记的行中,整体蛋白质组组成没有变化。

02 opencell数据库使用
opencell数据库阐明人类细胞的接线图是后基因组时代的中心目标。 我们结合了基因组工程、共聚焦活细胞成像、质谱和数据科学,系统地绘制了人类蛋白质的定位和相互作用。 我们的方法提供了对组织蛋白质组的分子和空间网络的数据驱动描述。 这些网络的无监督聚类描绘了促进生物学发现的功能群落,并揭示了 RNA 结合蛋白形成了由独特的相互作用和定位特性定义的特定亚组。 此外,我们发现可以从蛋白质定位模式中获得非常精确的功能信息,这些定位模式通常包含足够的信息来识别分子相互作用。 与完全互动的网站 opencell.czbiohub.org 配合使用,我们为人类细胞组织的定量制图提供了资源。
可以查询蛋白、染色质以及复合物



高清蛋白定位图片,可以下载tif格式

OpenCell结合了三种策略来增强对人类细胞结构的描述。 首先,OpenCell提出了一个用于高通量细胞生物学的综合实验流程,由基因组工程、活细胞显微镜和 IP-MS 的可扩展方法推动。 其次,OpenCell提供了精心策划的本地化和交互组测量的开源资源,可通过 opencell.czbiohub.org 上的交互式 Web 界面轻松访问。 第三,OpenCell开发了一个分析框架,用于表示和比较交互或本地化签名(包括用于图像编码的自我监督机器学习方法)。 最后,我们展示了我们的数据集如何用于细粒度的机械探索(探索以前未表征的多种蛋白质的功能),以及研究蛋白质组的核心组织原则。
数据库引用:
OpenCell: proteome-scale endogenous tagging enables the cartography of human cellular organization
关注R小盐,关注科研私家菜(VX_GZH: SciPrivate),有问题请联系R小盐。让我们一起来学习 生物信息在线数据库
网友评论