目前已有多种测序技术成为了药物研发过程中的得力工具,其中传统的bulk测序因不能解决细胞异质性问题,科学家基于bulk测序在药物靶点、Biomarker开发上存在很大的困难;而单细胞测序技术在单细胞水平获得细胞异质性信息,能够以前所未有的精度和视角去研究疾病形成和耐药机制,获得更加精准、个性化的数据,为新药开发、精准用药提供指导,极大地缩减药物研发周期。
01 单细胞大数据的应用
数据集整合,锁定疾病/组织特异性细胞亚群
将不同组织或同一疾病的不同样本数据整合,经过质控、标准化、批次效应校正等处理后,进行精细的细胞分群和细胞类型鉴定,可以发现疾病/组织特异性的细胞亚群。再通过进一步分析来寻找特定的治疗靶标,将加速药靶发现的进程。
寻找潜在药物靶点
单细胞转录组测序技术可以获得成千上万个细胞的基因表达谱,应用生物信息学方法通过比较不同条件下的单细胞数据,如:疾病组与健康组,找到不同细胞类群的差异基因集,来预测相关的生物标志物或药物靶点。
靶点筛选
利用单细胞大数据通过多种分析算法对潜在的药物靶点进一步筛选。比如:对获得的差异基因集进行生物学注释,是单细胞大数据后期数据挖掘的一个重要方向。常用到的工具有GO、KEGG、GSEA等进行功能富集,挖掘具有统计学意义的差异基因,并对这些基因进行功能注释。
靶点评估
单细胞大数据还能够用于潜在的药物靶点的特异性和安全性分析,应用生物信息学方法查看靶点基因在不同疾病类型、不同细胞类型中的表达,从而帮助评估靶点的细胞特异性/毒性,帮助研究者快速评估靶点的成药潜力。
02 问题与挑战——我们的解决方案
对于研究者如何应用单细胞大数据仍面临诸多挑战:一方面,应用单细胞测序技术发表的文章越来越多,并且仍在高速增长中,想要快速找到需要的数据犹如大海捞针;另一方面,过于庞大的数据集会导致研究者在进行数据检索以及数据整合挖掘时,消耗大量的时间和精力。为了解决研究者处理单细胞大数据面临的诸多挑战,百奥智汇建立了当前世界上最大规模的单细胞组学数据集OmniDatasets,为用户提供单细胞组学数据集萃取服务。OmniDatasets现已收录来自1600+项研究的3100+个数据集,6000万+单细胞的数据。研究领域涵盖肿瘤、疾病、发育、癌症、免疫、神经、细胞图谱等等。OmniDatasets可帮助药企、医院、高校等领域的科学家们进行更加高效的药物靶点发现、验证和科研探索。目前,已有多家国际顶尖药企、科研单位与百奥智汇达成了合作。
03 OmniDatasets优势
标准化的处理流程
我们根据国际顶尖药企的标准建立了数据处理标准化管线,采用可追踪和严格控制的工作流程来收集从公共数据库获得的数据,包括:样本描述、Cell Ontology、研究领域、组织类型等其他重要信息,且对其准确性进行多次验证,保证数据输出质量。
严格的细胞类型注释把控
为了确保数据集与文献的一致性, 我们优先采用来自作者的细胞类型注释和降维可视化坐标。细胞类型由多位数据标注人员根据文献提供的材料进行验证。作者提供的代码会用于进一步过滤或分析数据,以确保数据与文献的一致性。
实时更新
定期检索PubMed等网站,收录各领域最新发表研究成果。目前OmniDatasets每月更新2次共60个数据集。
多种交付格式选择
当前我们支持的数据集交付格式(如下表), 此外还可以根据客户的实际需求随时进行格式调整。
感兴趣的客户,请关注百奥智汇公众号(Abiosciences),随时联系,做进一步咨询;也可通过以下链接查看详情https://store.abiosciences.com.cn/。
网友评论