含有各种分子的胞外囊泡(ev)在细胞间的通信中起着至关重要的作用。非编码rna(ncRNAs)是ev中重要的功能分子和生物标志物。全面研究不同条件下ncrna的表达是ev功能发现和应用的基础步骤。
在这里,我们收集了2030个人类ev(1506个sEV和524个小RNA-seqlEV)。我们采用了一个统一的读取动态分配算法(RDAA),考虑错配和多捕获读取,以量化7种ncRNA类型(miRNA、snoRNA、piRNA、snRNA、rRNA、tRNA和YRNA)的表达谱。
我们构建了EVAtlas(http://bioinfo.life.hust.edu.cn/EVAtlas),一个全面的具有四个功能模块的ncRNA表达的数据库。
- 浏览和比较来自24种条件和8种来源(血浆、血清、唾液、尿液、精子、母乳、原代细胞和细胞系)的ev中ncrna的分布
- 根据条件相关组织中的候选ncrna进行优先排序
- 探索24种条件下ev中特异性表达的ncrna
- 研究ncRNA的功能、相关药物、靶基因和ev的分离方法
文章信息
- 文献标题:EVAtlas: a comprehensive database for ncRNA expression in human extracellular vesicles
- Doi:https://doi.org/10.1093/nar/gkab668
- 发表时间:13 August 2021 Nucleic Acids Research
- 通讯作者:An-Yuan Guo 华中科技大学生命科技学院教育部分子生物物理重点实验室
关键信息
- 过滤clean reads低于5M
- reads非主要分布于15-50nt
- 比对率小于40%
- EVs小RNA数据-12% reads有错配
数据收集过程就不详细描述了
ev中7种ncrna的Reads比对和丰度估计
各自比对序列下载:
- miRNAs:miRBase V22
- snoRNAs:snoDB
- tRNAs:GtRNAdb
- piRNAs and rRNAs: RNAcentral
- snRNAs and Y RNAs:NCBI GenBank
比对软件:Bowtie,one mismatch allowed
由于一些短读序列可能被映射到多个ncRNA参考序列中,这些reads的最终分配可能会影响ev中ncRNA的比例。为了解决这个问题,我们评估了9项研究(每个研究有超过10个样本)中的ncRNA分布,共计682个样本。
在图1中间的饼图中,我们可以看到87.79%的read有零错配,12.21%的reads有一次错配。接下来,我们发现超过93.5%的reads平均只映射到一种ncRNA类型(图1A,左右饼状图),大约6%的reads可以映射到多ncRNA类型。在每个研究中,多ncrna类型的reads是不同的。
image-20220526164206608.png为了将大约6%的多ncRNA映射reads分配到确切的ncRNA类型,我们创造性地采用了读取动态分配算法(RDAA),该算法基于一个合理的假设,即多ncRna映射read更有可能来自更高比例的ncRNA类型。
image-20220526164234676.png首先,我们使用独特的映射reads总结每个研究中ncRNA的分布,发现不同研究中主要ncRNA类型差异显著。
image-20220526220820875.png采用RDAA比对方法,过滤标准:ncRNAs with RPM > 1 were kept further analyses and deposited into EVAtlas
EVAtlas的数据汇总:
EVAtlas包含7种类型的ncRNA表达谱,来自1506个sEVs和52030个smRNA-seq数据集,在这些数据集中(RPM>1)共检测到30 445 个ncrnas,其中包括2527个miRNAs。
image-20220526221252771.png总结所有这些数据集(图2B饼图),ev中rRNA(38.12%)、miRNA(26.94%)、tRNA(19.19%)和YRNA(12.59)的丰度约占ncRNA的97%。piRNA(1.51%)、snRNA(1.05%)和snoRNA(0.6%)是次要的ncRNA类型。
网友评论