详细内容:
开门见山
www.scRNA-tools.org:专门收集scRNA-seq分析的工具
使用scRNA-tools数据库探索单细胞RNA-seq分析领域
Exploring the single-cell RNA-seq analysis landscape with the scRNA-tools database
杂志:plos computational biology
时间:收稿日期: 2017年12月6日; 接受日期: 2018年5月30日; 发布时间: 2018年6月25日
作者:卢克扎皮亚
角色 概念化,形式分析,调查,方法论,软件,写作 - 原始草稿,写作 - 审查和编辑
隶属于 生物信息学,默多克儿童研究所,墨尔本,维多利亚,澳大利亚,墨尔本大学,墨尔本,维多利亚,澳大利亚科学学院生物科学学院
http://orcid.org/0000-0001-7744-8565
贝琳达皮森
角色 监督,写作 - 审查和编辑
隶属 生物信息学,默多克儿童研究所,墨尔本,维多利亚州,澳大利亚
http://orcid.org/0000-0002-1711-7454
艾丽西亚奥什拉克
角色 监督,写作 - 审查和编辑
*电子邮件: alicia.oshlack@mcri.edu.au
隶属于 生物信息学,默多克儿童研究所,墨尔本,维多利亚,澳大利亚,墨尔本大学,墨尔本,维多利亚,澳大利亚科学学院生物科学学院
[TOC]
摘要
随着单细胞RNA测序(scRNA-seq)数据集的普及,用于分析这些数据的工具数量急剧增加。现在可用的大量工具导航对于研究人员来说变得越来越具有挑战性。为了更好地选择合适的分析工具,我们创建了scRNA-tools数据库(www.scRNA-tools.org)在分析工具可用时对其进行分类和辅助分析。我们的数据库收集有关每个scRNA-seq分析工具的一系列信息,并根据他们执行的分析任务对其进行分类。对该数据库的探索提供了对scRNA-seq数据分析方法快速发展领域的见解。我们看到许多工具执行特定于scRNA-seq分析的任务,特别是细胞的聚类和排序。我们还发现scRNA-seq社区采用开源和开放科学的方法,大多数工具在开源许可下可用,且被广泛用作描述方法的手段。scRNA-tools数据库为开展scRNA-seq分析的研究人员提供了宝贵的资源,并随时间记录了该领域的成长。
作者摘要
近年来,出现了单细胞RNA测序技术,使科学家能够同时测量数千个细胞中基因的活性。这意味着我们可以开始查看样本中每个cell正在做什么,而不是考虑样本中所有cell的平均值,就像旧技术的情况一样。然而,虽然访问这类数据提供了大量机会,但它带来了一系列新挑战。世界各地的研究人员已经开发出新的方法和软件工具来充分利用这些数据集,但该领域正在以如此快的速度发展,很难跟上目前可用的数据。为了使这更容易,我们开发了scRNA-tools数据库和网站(www.scRNA-tools.org)。我们的数据库目录分析工具,记录它们可以用于的任务,可以从哪里下载以及描述它们如何工作的出版物。通过查看此数据库,我们可以看到开发人员专注于特定于单细胞数据的方法,并且他们采用开源方法,允许许可,共享代码和发布预打印出版物
可以用于的任务,可以从哪里下载以及描述它们如何工作的出版物
# 还有引用情况的排序高低,包含但不限于R、python、C++
介绍
单细胞RNA测序(scRNA-seq)作为在单个细胞的分辨率下询问转录组的有效工具已迅速获得牵引力。自第一个方案于2009年发表[ 1 ] 以来,个体scRNA-seq实验中分析的细胞数量呈指数增长,超过了摩尔定律[ 2 ]。这种新的转录组数据需要新的分析方法。scRNA-seq数据集的规模不仅比大量实验的规模大得多,而且单细胞环境也存在各种独特的挑战[ 3]]。具体来说,scRNA-seq数据极其稀疏(在大多数细胞中没有测量许多基因的表达),它可能具有技术假象,例如低质量细胞或测序批次之间的差异,并且感兴趣的科学问题通常不同于那些询问批量RNA-seq数据集。例如,通过设计的实验产生许多大量RNA-seq数据集以发现差异表达的基因,而许多scRNA-seq实验旨在鉴定或分类复杂组织中的细胞类型。
2009年单细胞技术开始问世?!
在大多数细胞中没有测量许多基因的表达),它可能具有技术假象,例如低质量细胞或测序批次之间的差异
# 低质量细胞,或者测序得到基因个数比较的cell,会在后续的过滤中,有一点过滤。
# 理论支持分析技术
# 单细胞技术应用:
鉴定或分类复杂组织中的细胞类型
生物信息学界以惊人的速度接受了这种新型数据,设计了大量的scRNA-seq数据分析方法。跟上scRNA-seq分析的当前状态现在是一项重大挑战,因为该领域提供了大量用于分析数据集的选择。自2016年9月起,我们对scRNA-seq分析工具进行了整理和分类。该数据库正在不断更新,可在www.scRNA-tools.org上公开获取。为了帮助研究人员驾驭分析工具的广阔海洋,我们在scRNA-seq分析的典型阶段的背景下对数据库中的工具进行分类。通过对该数据库的分析,我们不仅展示了这些方法所解决的分析应用程序的趋势,还展示了它们如何发布和许可,以及它们使用的平台。<u>基于该数据库,我们深入了解了这个快速发展的领域当前工具的现状</u>。
设计和实施
数据库
scRNA-tools数据库包含专门用于分析scRNA-seq数据的软件工具的信息。要使某个工具有资格包含在数据库中,它<u>必须可供下载和公共使用</u>。这可以来自软件包存储库(例如Bioconductor [ 4],CRAN或PyPI),代码共享网站,如GitHub或直接来自私人网站。当我们注意到新工具时,它们会被添加到scRNA-tools数据库中。记录任何相关出版物的DOI和出版日期。由于预印本可能经常更新,因此它们被标记为预印本而不是记录日期。还记录了用于构建工具的平台,代码存储库的链接,相关许可证和简短描述。每个工具都根据它可以执行的分析任务进行分类,根据随附的文章或文档中的描述,为每个类别接收真或假。我们还记录了每个条目添加到数据库的日期以及上次更新的日期。https://github.com/seandavi/awesome-single-cell)。
网站
为了构建网站,我们从上面描述的表开始,作为使用R脚本处理的CSV文件。将下载CRAN,Bioconductor,PyPI和Anaconda软件存储库中可用的软件包列表,并与数据库中的工具进行匹配。对于具有相关出版物的工具,使用rcrossref软件包(v0.8.0)[ 5 ] 从Crossref数据库(www.crossref.org)检索他们收到的引用次数。我们还使用aRxiv包(v0.5.16)[ 6 ]来检索有关arXiv预印本的信息。生成描述完整表,工具和类别的JSON文件,并用于填充网站。
# R包
rcrossref软件包(v0.8.0)检索Crossref数据库([www.crossref.org](http://www.crossref.org/))检索他们收到的引用次数
aRxiv包(v0.5.16)
该网站由三个主页组成。主页显示了一个交互式表,可以对数据库进行排序,过滤和下载。第二页显示每个工具的条目,给出说明,出版物的详细信息,软件代码和许可证的详细信息以及相关的软件类别。徽章被添加到工具中,以提供任何相关软件或GitHub存储库的清晰可见的详细信息。最后一页描述了类别,可以轻松访问与其相关的工具。工具和类别页面都可以以多种方式进行分类,包括相关出版物或引文的数量。另一页显示了此处提供的一些分析的实时和最新版本,其中使用ggplot2(v2.2.1.9000)生成可视化[ 7]和情节(v4.7.1)[ 8 ]。我们欢迎通过向GitHub项目页面(https://github.com/Oshlack/scRNA-tools)提交问题或通过填写scRNA-tools网站上的提交表单,从更广泛的社区向数据库做出贡献。
ggplot2 (v2.2.1.9000) [7] and plotly (v4.7.1)
分析
最新版本的scRNA-tools数据库截至2018年6月6日用于本文提供的分析。使用dplyr包(v0.7.5)[ 9 ] 在R(v3.5.0)中操作数据,并使用ggplot2(v2.2.1.9000)和cowplot(v0.9.2)[ 10 ]包产生图。
dplyr包(v0.7.5)
ggplot2(v2.2.1.9000)和cowplot(v0.9.2)
结果
scRNA-tools数据库概述
当数据库首次构建时,它包含70个scRNA-seq分析工具,代表了自2013年11月至2016年9月SAMstrt [ 11 ] 发布三年期间该领域的大部分工作。自那时起超过160个新工具已被添加(图1A)。在如此短的时间内,可用工具数量几乎增加了三倍,这表明人们对scRNA-seq及其成熟的兴趣日益浓厚,从需要定制设备和专用方案的技术到商用产品。
journal.pcbi.1006245.g001.PNG图1 (A)scRNA-tools数据库中的工具数量随着时间的推移。自scRNA-seq工具数据库于2016年9月启动以来,已发布了160多种新工具。(B)scRNA-tools数据库中工具的发布状态。完整数据库中超过一半的工具至少有一个已发布的peer-revirew文件,而另外三个工具在预印本中有描述。(C)当按日期分层工具添加到数据库时,我们看到2016年10月之前添加的大多数工具都已发布,而大约一半的新工具仅作为预印本提供。更新的工具也更有可能以任何形式取消发布。(D)大多数工具都可以使用R或Python编程语言。(E)大多数工具都是在标准的开源软件许可下发布的,GNU公共许可证(GPL)的变体是最常见的。但是,大部分工具都找不到许可证。这些图的最新版本(C除外)可在scRNA-tools网站的分析页面上找到(https://www.scrna-tools.org/analysis)。
# preprints预印品:应该是指published前的状态的paper
出版状态: 大多数工具在引入我们注意的出版物或描述其方法和用途的预印本之后被添加到scRNA工具数据库中。在数据库中的所有工具中,大约一半的工具在同行评审期刊中至少有一个出版物,另外三个在预印本文章中描述,通常在bioRxiv预印本服务器上(图1B)。工具可以拆分为创建数据库时可用的工具和自之后添加的工具。我们可以看到大多数旧工具已经发布,而更新的工具更有可能仅作为预印本提供(图1C)。这很好地证明了传统出版过程所造成的延迟。通过发布预印本和通过GitHub等存储库发布软件,scRNA-seq工具开发人员可以更早地将其工具提供给社区,使其可用于分析,并在正式发布之前改进其方法[ 12 ]。
平台和许可: scRNA-seq分析工具的开发人员可以选择使用他们用来创建工具的平台,他们如何向社区提供这些工具以及他们是否共享源代码。我们发现创建scRNA-seq分析工具最常用的平台是R统计编程语言,通过Bioconductor或CRAN存储库提供了许多工具(图1D)。Python是第二种最流行的语言,其次是MATLAB,一种专有的编程语言,以及较低级的C ++。R和Python的使用与它们在一系列数据科学领域的普及性是一致的。特别是R的流行反映了其作为分析大量RNA-seq数据集和一系列其他生物数据类型的首选语言的历史。
我们发现创建scRNA-seq分析工具最常用的平台是R统计编程语言,通过Bioconductor或CRAN存储库提供了许多工具
# R包很多
scRNA-tools数据库中的大多数工具都是采用开源方法开发的,使得它们的代码在许可软件许可下可用(图1E))。我们认为这反映了生物信息学社区分享和建立他人工作的一般潜在情感和意愿。GNU公共许可证(GPL)的变化是最常见的,几乎覆盖了一半的工具。此许可证允许免费使用,修改和分发源代码,但也具有“copyleft”性质,要求任何衍生工具披露其源代码并使用相同的许可证。MIT许可证是第二大最受欢迎的许可证,它允许出于任何目的使用代码,但对分发或许可没有任何限制。几乎四分之一的工具无法识别相应的许可证。这是有问题的,因为开发人员必须假设源代码不能被重用,这可能会限制这些工具中方法的有用性。
scRNA-seq分析的类别
单细胞RNA测序通常用于以无监督的方式探索细胞类型的复杂混合物。正如在以前的评论中描述在此设置一个标准scRNA-seq的分析包括可以使用各种工具[完成几个任务13 - 17 ]。在scRNA-tools数据库中,我们根据工具执行的分析任务对工具进行分类。在这里,我们将这些任务分为四个广泛的分析阶段:数据采集,数据清理,细胞分配和基因鉴定(图2)。数据采集阶段(阶段1)从测序实验中获取原始核苷酸序列,并返回描述每个细胞中每个基因表达的矩阵。该阶段包括大量RNA-seq实验常见的任务,例如与参考基因组或转录组的比对以及表达的定量,但通常扩展到处理独特的分子标识符(UMI)[ 18]]。一旦获得表达矩阵,确保结果数据具有足够高的质量至关重要。在数据清洗阶段(阶段2),进行细胞的质量控制以及过滤无信息基因。可以执行附加任务以标准化数据或估算缺失值。探索性数据分析任务通常在此阶段执行,例如以缩小的维度查看数据集以查找底层结构。
# 数据采集
大量RNA-seq实验常见的任务,例如与参考基因组或转录组的比对以及表达的定量,处理UMI,得到表达矩阵
# 数据清理
细胞的质量控制以及过滤无信息基因
以标准化数据或估算缺失值
探索数据集:探索性数据分析任务通常在此阶段执行,例如以缩小的维度查看数据集以查找底层结构。
journal.pcbi.1006245.g002.PNG
图2.典型的无监督scRNA-seq分析过程的阶段。
在阶段1(数据采集)中,通过细胞表达矩阵将原始测序读数转换成基因。对于许多方案,这需要基因与参考基因组的比对以及独特分子标识符(UMI)的分配和重复数据删除。然后清除数据(阶段2)以去除低质量细胞和无信息基因,从而产生用于进一步分析的高质量数据集。数据也可以归一化,并在此阶段估算缺失值。阶段3以离散方式将细胞分配给已知(分类)或未知(聚类)组或连续轨迹上的位置。然后鉴定有趣的基因(例如,差异表达的,标记,特定的表达模式)以解释这些组或轨迹(阶段4)。
高质量的表达矩阵是下一阶段分析的重点。在阶段3中,通过聚类或沿着从一种细胞类型到另一种细胞类型的连续轨迹将细胞分配给离散组。随着高质量参考数据集的出现,将细胞直接分类为不同细胞类型也变得可行。一旦分配了细胞,分析的焦点就转向解释这些分配的含义。识别有趣的基因(第4阶段),例如那些在组间差异表达的基因,在单个组中表达的标记基因或沿着轨迹改变表达的基因,是这样做的典型方法。然后可以通过研究基因本身或通过技术或数据集试验来获得更高水平概括来解释实验中这些基因的生物学意义,从而为实验提供意义。
# 细胞分配-聚类分析
一种细胞类型到另一种细胞类型的连续轨迹将细胞分配
分析重点:解释分配的含义
# 基因鉴定
找到有趣基因
虽然可以采用其他方法来分析scRNA-seq数据,但这些阶段代表了从原始测序读数到适用于许多研究的生物学见解的最常见途径。例外情况可能是设计用于测试特定假设的实验,其中细胞群可能已被分类,或者兴趣在于实验条件而非细胞类型之间的差异。在这种情况下,可能不需要阶段3,并且可以使用略微不同的工具或方法,但是将应用许多相同的挑战。此外,随着该领域的扩展和发展,数据可能会以新的方式用于回答其他生物学问题,需要新的分析技术。表1中给出了scRNA工具数据库中类别的描述,以及相关的分析阶段。
journal.pcbi.1006245.t001.PNG表1. scRNA-tools数据库中工具类别的描述。
scRNA-seq分析任务的趋势: 数据库中的每个工具都分配给一个或多个分析类别。我们进一步详细研究了这些类别,以深入了解scRNA-seq分析的趋势。图3A显示了执行每个分析任务的工具的频率。可视化是最常见的任务,在探索和显示数据和结果的所有分析阶段都很重要。分配单元格的任务(排序和聚类)是下一个最常见的任务。这一直是与集群工具在单细胞分析发展的最大面积,例如Seurat [ 19,20 ],SC3 [ 21 ]和BackSPIN [ 22]所使用的样品和轨迹分析工具来识别的细胞类型(例如单片眼镜[ 23 - 25],横臂[ 26 ]和DPT [ 27 ])被用来研究基因跨越发育过程如何变化。这些领域反映了单细胞数据提供的新分析机会,这是大量RNA-seq实验无法实现的。
tools:
1. 可视化最多(含降维)
2. 细胞的排序和聚类:例如Seurat、SC3、和BackSPIN!!!
journal.pcbi.1006245.g003.PNG
图3(A)scRNA-tools数据库中的工具类别。可以根据可以完成的任务将每个工具分配到多个类别。与多个分析阶段(可视化,降维)相关联的类别是最常见的类别,与细胞分配阶段(排序,聚类)相关联的类别也是最常见的。(B)分析类别随时间的变化,比较2016年10月之前和之后添加的工具。与可视化,降维,基因网络和模拟相关的工具百分比显着增加。包括表达模式,排序和交互性在内的类别相对减少。(C)随着时间的推移与分析阶段相关的工具百分比的变化。数据采集和数据清理阶段涉及的工具百分比增加,为替代分析任务设计的工具也增加了。基因识别阶段的工具数量相对减少。(D)与scRNA-tools数据库中的每个工具相关的类别数。大多数工具执行的任务很少。(E)完成许多任务的大多数工具都是相对较新的。
降维也是一项常见任务,可应用于可视化(通过诸如t-SNE [ 28 ]等技术),质量控制和作为分析的起点。差异表达(DE)测试可能是对大量RNA-seq数据集进行的最常见分析,它也常用于许多scRNA-seq分析工具,通常用于鉴定一组细胞中与其他细胞不同的基因。 然而,应当注意的是,通过scRNA-SEQ工具施加的DE测试往往是不那么复杂的工具严格的统计结构 bulk RNA-SEQ开发诸如edgeR[ 29,30 ],DESeq2 [ 31 ]和LIMMA [ 32],经常使用简单的统计检验,如似然比检验。虽然方法设计测试DE特别是在单细胞数据集确实存在(如SCDE [ 33 ],和SCDD [ 34 ]),目前还不清楚他们是否在已经建立了大容量数据[方法提高35 - 37 ],与日期发现最全面的比较,批量方法的表现并不比scRNA-seq数据设计的差[ 38 ]。
降维也是一项常见任务,可应用于可视化(通过诸如t-SNE等技术)
差异表达(DE)测试可能是对大量RNA-seq数据集进行的最常见分析,它也常用于许多scRNA-seq分析工具。通常用于鉴定一组细胞中与其他细胞不同的基因。
# 比较
bulk RNA-seq工具施加的DE测试:edgeR、DESeq2 、LIMMA
设计测试DE特别是在单细胞数据集确实存在(如SCDE和SCDD),目前还不清楚他们是否在已经建立了大容量数据
为了研究scRNA-seq工具开发的重点如何随着时间的推移而改变,我们再次将scRNA-tools数据库划分为2016年10月之前和之后添加的工具。这使我们能够看到哪些分析任务在最近发布的工具中更常见。我们研究了在不同分析类别中执行任务的每个时间段内的工具百分比(图3B))。某些类别显示执行它们的工具比例变化不大,而其他区域发生了显着变化。具体而言,最近的工具更常见地解决了可视化和降维问题。UMI种类最近也出现了大幅增长,因为基于UMI的方案已经普遍使用,并且已经开发了用于处理所需额外处理步骤的工具(例如UMI-tools [ 39 ],umis [ 40 ],zUMIs [ 41 ]) 。模拟是开发,测试和验证scRNA-seq工具的有用技术。现在有更多的软件包包括它们的模拟功能,并且已经开发了一些工具用于生成真实的合成scRNA-seq数据集的特定目的(例如powsimR [ 42]],Splatter [ 43 ])。随着参考数据集变得可用并且更多工具识别或利用共同调节的基因网络,细胞分类成已知组也已增加。
UMI处理工具:
UMI-tools 、umis 、zUMIs
合成真实数据的R:powsimR 、Splatter
有些类别的工具比例有所下降,最引人注目的是沿着轨迹测试表达模式。这可能与细胞排序分析的变化有关,细胞排序分析是2016年10月之后添加的较低百分比工具的重点。细胞沿着轨迹的排序是scRNA-seq分析的最初发展之一,并且这些工具的开发可能表明研究人员已经转向其他技术,或者已经将这些技术融合到一套成熟的工具上。
细胞排序分析策略,早期出现的,也有可能未来被更新~
通过基于相关分析阶段对类别进行分组,我们可以看到类似的趋势(图3C))。我们看到,在多个阶段(例如可视化和降维)和替代分析任务中,在阶段1(量化)中执行任务的工具百分比有所增加。相比之下,执行基因识别任务(第4阶段)的工具的百分比已经减少,并且分配细胞的百分比(阶段3)保持稳定。阶段2(质量控制和过滤)随着时间的推移而波动,但目前处于略高于首次创建数据库时的水平。这也表明分析空间的成熟,因为开发人员偏离了批量RNA-seq分析的重点任务,并继续关注scRNA-seq特有的那些,同时致力于处理来自新方案的数据和执行替代方案的方法分析任务。
管道和工具箱: 虽然有相当数量的scRNA-seq工具只执行单个分析任务,但许多工作至少执行两次(图3D)。一些工具(dropEst [ 44 ],DrSeq2 [ 45 ],scPipe [ 46 ])是预处理管道,采用原始测序读取并产生表达矩阵。其他如Scanpy [ 47 ],SCell [ 48 ],Seurat,Monocle和scater [ 49 ]可以被认为是分析工具箱,能够从基因表达矩阵开始完成一系列复杂分析。完成许多任务的大多数工具都是相对较新的(图3E)。能够使用单个工具完成多个任务可以简化分析,因为可以避免在不同数据格式之间转换的问题。然而,重要的是要记住,具有许多功能的工具难以继续代表所有这些功能的现有技术。支持通用数据格式,例如最近发布的SingleCellExperiment [ 50 ],anndata [ 47 ]或loom(http://loompy.org)对象,为开发人员提供了另一种方式,允许他们轻松使用他们的工具,并为用户构建自定义专业工具的工作流程。
一些工具(dropEst 、DrSeq2 、scPipe)是预处理管道,采用原始测序读取并产生表达矩阵。
Scanpy 、SCell、Seurat,Monocle和scater可以被认为是分析工具箱,能够从基因表达矩阵开始完成一系列复杂分析
替代分析: 一些工具执行的分析不在上述scRNA-seq数据上执行的常见任务之外。模拟是已经提到的一个替代任务,但是还有一组工具被设计用于检测除了表达变化之外的scRNA-seq数据中的生物信号。例如,识别可变剪接(BRIE [ 51 ],Outrigger [ 52 ],SingleSplice [ 53 ]),单核苷酸变异(SSrGE [ 54 ]),拷贝数变异(inferCNV [ 55 ])和等位基因特异性表达(SCALE [ 56] ])。免疫细胞受体的重建是另一个区域,收到相当关注的领域,例如BASIC [ 57 ],TraCeR 等工具。58 ]和TRAPeS [ 59 ]。虽然完成这些任务的工具不太可能主导scRNA-seq分析,但我们期望看到研究专业分析的方法有所增加,因为研究人员继续推动使用scRNA-seq数据观察到的界限。
单细胞也可以分析的类别:
识别可变剪接:BRIE、Outrigger、SingleSplice
单核苷酸变异(SSrGE)
拷贝数变异(inferCNV)
等位基因特异性表达(SCALE)
免疫细胞受体的重建: BASIC、TraCeR 、TRAPeS
可用性和未来方向
自2016年10月以来,我们已经看到用于分析单细胞RNA-seq数据的软件工具数量超过三倍,现在有超过230种分析工具可用。随着新工具的推出,我们已经在scRNA工具数据库中对其进行了策划和编目,在这些数据库中我们记录了他们可以完成的分析任务,以及其他信息,例如任何相关的出版物。通过分析该数据库,我们发现工具开发人员将他们的大部分精力集中在处理scRNA-seq数据特有的新问题的方法上,特别是将细胞聚类成组或沿着轨迹对它们进行排序。
未来几年有望在scRNA-seq分析中产生重大的新发展。将继续生产新工具,变得越来越复杂,旨在解决scRNA-seq数据可能带来的更多问题。我们预计一些现有工具将继续改进和扩展其功能,而其他工具将不再更新和维护。详细的基准测试和比较将显示工具在不同情况下的表现以及表现良好,持续开发并提供良好用户体验的工具将成为标准分析的首选。随着单细胞捕获和测序技术不断改进,分析工具必须适应可能需要专门数据结构和算法的显着更大的数据集(在数百万个细胞中)。组合多个scRNA-seq数据集以及将scRNA-seq数据与其他单细胞数据类型(例如DNA-seq,ATAC-seq或甲基化)整合的方法将是另一个增长领域。此外,Human Cell Atlas等项目[60]将提供全面的细胞类型参考,将开辟新的分析途径。
组合多个scRNA-seq数据集以及将scRNA-seq数据与其他单细胞数据类型(例如DNA-seq,ATAC-seq或甲基化)整合的方法将是另一个增长领域.
# 多组学分析
Human Cell Atlas等项目
随着该领域的扩展,scRNA-tools数据库将继续在社区的支持下进行更新。我们希望它为研究人员提供了一种资源,可以在接近scRNA-seq分析时进行探索,并提供分析前景及其随时间变化的记录。
可用性
scRNA-tools数据库可通过网站www.scRNA-tools.org公开访问。有关添加,更新和改进的建议在相关的GitHub存储库(https://github.com/Oshlack/scRNA-tools)或网站上的提交表单中受到热烈欢迎。本文中用于分析的代码和数据集可从https://github.com/Oshlack/scRNAtools-paper获得。
scRNA-tools:
(https://github.com/Oshlack/scRNAtools-paper)
致谢
我们要感谢Sean Davis在管理令人敬畏的单细胞page和生成用于处理数据库的脚本原型方面的工作。Daniel Wells有想法记录软件许可证,并为当时数据库中的工具提供许可证。Breon Schmidt设计了scRNA-tools网站的原型,回答了很多关于HTML和Javascript的问题。我们还要感谢Matt Ritchie对早期版本手稿的看法。
彩蛋
请认真看表1:理解任务分为四个广泛的分析阶段:数据采集,数据清理,细胞分配和基因鉴定(并非全部都必须)
网友评论