美文网首页生信工具生物信息学与算法生信分析流程
系统学习单细胞转录组测序scRNA-Seq(二)

系统学习单细胞转录组测序scRNA-Seq(二)

作者: 刘小泽 | 来源:发表于2019-03-16 23:34 被阅读45次

    刘小泽写于19.3.16
    看了一篇综述,又加了一些扩展知识

    文章

    这是一篇2017发表在Genome Medicine上的文章A practical guide to single-cell RNA-sequencing for biomedical research and clinical applications

    背景

    • 单细胞测序:《Nature Methods》2013年度技术;《Nature》2017年7月刊的封面推荐 ;《Science》2018十大科学突破榜首
    • 研究细胞的方法:基因组DNA序列(碱基如何排列、各个序列的丰度)、染色质结构(常听说的3C、4C、5C、HiC等)、mRNA序列(排列与丰度)、非编码RNA、蛋白表达、蛋白修饰、细胞代谢【因此不只有scRNA,还有sc基因组、sc表观组】
    • 一个细胞中的待研究分子是微量的,因此我们一般使用几千细胞或直接取组织(上千万甚至上亿),这样就可以积累足够的分子信息,可以开展 Genome-wide association studies (GWASs) 、鉴定SNPs
    • 主要做什么:分离新细胞亚群、构建细胞间互作网络、体内与体外实验反应、细胞在不同器官的情况、不同人群比较、不同物种比较
    • 总体≠个体:细胞异质性的存在(受精卵发育成个体,最终去向十分多样=》肌肉细胞、神经细胞等等,why?;肿块中心、周围、转移中的细胞各异,分离出来判断疗法有效性)
    • 挑战:同时检查单个细胞中表达的数千种蛋白质(蛋白组研究范畴),这个完整性有待提高

    名词

    Barcoding

    • 之前做单细胞,真的是一个个细胞取出来,然后独立构建文库测序(比如:流式细胞术、激光捕获显微切割LCM=》组织切片),但是这通量非常低(有点Sanger测序和二代测序对比的感觉)。
    • 后来发展出高通量的方法,主要是给每个细胞加上独一无二的DNA序列(就是条形码barcode,就是为了识别),然后测序时将相同的barcode序列归为同一个细胞来源
    • 单细胞转录组可以在polyT引物5'端加上barcode;单细胞基因组目前主要利用高效转座酶(transposase)Tn5实现

    Spike-in

    • Spike-ins can be used for assessing the level of technical variability and for identifying genes with a high degree of biological variability

    • 每个细胞都是独特的,和普通的Bulk RNA-seq不同,材料不容易获得,不太好做重复,因此通过生物学重复来评价技术手段/数据质量的方法不靠谱。

    • 但是数据质量还是需要评价的,那么就通过向每个细胞裂解液中加入已知序列与一定数量的合成mRNA,例如 external RNA control consortium (ERCC)【翻译的话,姑且翻译成:外源RNA对照联盟】开发的“内参”,可以根据RNA读数判断样本间差异

    • 高ERCC含量与低质量数据相关

    • 但是使用spike-in也有一些问题要注意:

      • has to carefully calibrate the concentration that results in an optimal fraction of reads from the spike-ins
      • spike-in mixes are sensitive to degradation
      • captured less efficiently than endogenous transcripts
      • Spike-in不适用于droplet-seq的方法
    • UMI( Unique molecular identifier )

      • barcoding的变体,待扩增的RNA分子用随机n-mer寡核苷酸标记。设计不同标签的数量,大大超过待扩增的转录本,产生独特标记的分子,并允许控制扩增偏差【例如10-mer的UMI,就会有 4的十次方 约等于100万种变化】
      • UMI是一段随机序列,每一个DNA分子都有自己的UMI序列。可以大大降低PCR误差(比如:原来两个样本中某基因表达量相同,但是由于两个样本扩增效率不同,样本1为99%,样本2只有95%,那么同时扩增40个循环,这同一个基因就有了0.99^40 / 0.95^40 = 5.2倍差异,因此本来没有差异也会因为外界因素扩增效率的影响而产生“假阳性”)
      • UMI只用在3'转录本测序的方法中,如CEL-seq2, Drop-seq, MARS-seq

    Dropout

    • 基因在一个细胞中有表达,但在另一个细胞中未检测到(按照道理,每个基因应该都可以检测到,只是表达量多少)
    • 可能源于RNA总量少导致扩增建库丢失 或者 RNA表达随机性

    Mass cytometry

    • 基于流式细胞法和质谱,其中使用元素标签标记的抗体检测蛋白质表达 - 允许在一次实验中对数千个单细胞上的数十种蛋白质进行平行测定

    Split-pooling

    Basic step

    • The first, and most important, step in conducting scRNA-seq has been the effective isolation of viable, single cells from the tissue of interest
    • Next, isolated individual cells are lysed to allow capture of as many RNA molecules as possible.
    • Next, poly[T]-primed mRNA is converted to complementary DNA (cDNA) by a reverse transcriptase.
    • Then, amplified and tagged cDNAfrom every cell is pooled and sequenced by NGS.

    Types of material

    • 理论上,任何真核生物细胞都可以
    • Primary cells
      • 胚胎 embryo
      • 肿瘤 tumours
      • 神经 nervous system
      • 造血 haematopoietically derived cells
    • The Human Cell Atlas
      • 2017年启动,“媲美人类基因组计划”,核心技术=》单细胞组学
      • 对人类37万亿个细胞进行细胞采集、分类和绘图,侧重描绘组织,而不是整个器官;后期阶段可以纳入器官及感兴趣的疾病小群体
      • 2018.3.8,Sanger研究所宣布人类发育细胞图谱(Human Developmental Cell Atlas ,HDCA)的初步项目25万个发育细胞测序完成

    补充:测序平台

    • 10X Genomics
      • 2016.2推出 Chromium
      • 通量高(7分钟内完成100~80,000个细胞的捕获),周期短,成本低,细胞捕获效率高(单个样本细胞捕获率高达65%);细胞活性要求>90% =》 适用于发现新细胞
      • 横向孔道逐个导入凝胶微珠Gel beads =》 第一个纵向道输入细胞 =》Gel吸附细胞=》微流控技术送到第二个纵向通道(“油tube”)=》油滴GEMs 【因此,一个油滴就是一个Gel bead,也就是一个细胞】=》收集到EP管 =》每个Gel bead表明都放满了各不相同的Barcode和UMI序列+polyT =》细胞裂解,polyT抓取mRNA的3'polyA
    • BD Rhapsody
      • 分子标签技术(每个转录本标记特异性分子标签)=》单细胞水平上基因表达谱的绝对定量
      • 单次实验可制备100-10000个单细胞文库
      • CytoSeq特有的蜂窝板技术(20W+的微孔),避免了10X中存在的概率碰撞影响捕获效率问题
      • 可以多样本混合捕获;成像系统;转录组-蛋白组联合分析
    • Wafergen公司 ICELL8
      • 基于微流控芯片,5184个反应孔
      • 每次运行可分离500-1000个细胞
      • 捕获效率为30%,成本相对较低
    • Fluidigm公司C1
      • 通量低、成本高(2000-3000细胞需要18000-100000美元)、周期慢
      • 同时捕获96个细胞
      • 全长转录组
    • llumina Bio-Rad
      • ddSEQ
      • 一次性检测8个样本,每个样本可以得到500~10000个细胞
      • 组织功能、病情进展和治疗反应方面的协同作用
      • 捕获效率低,仅为3%;成本低
    • 1CellBio => InDrop
    • Dolomite => µEncapsulator

    欢迎关注我们的公众号~_~  
    我们是两个农转生信的小硕,打造生信星球,想让它成为一个不拽术语、通俗易懂的生信知识平台。需要帮助或提出意见请后台留言或发送邮件到jieandze1314@gmail.com

    Welcome to our bioinfoplanet!

    相关文章

      网友评论

        本文标题:系统学习单细胞转录组测序scRNA-Seq(二)

        本文链接:https://www.haomeiwen.com/subject/hfzdmqtx.html