#circRNA从入门到精通
【01】miRNA、LncRNA、CircRNA靠谱小结
【02】首先了解一下circRNA背景知识
circRNA形成的3种方式:
circRNA产生方式包括外显子环化和内含子环化。
circRNA的3大功能:
1.充当miRNA“海绵”
2.调节转录和剪接
3.与RNA结合蛋白相互作用
收集整理好的circRNA相关数据库【见原文】
【03】circRNA芯片分析的一般流程
临床课题设计的一般原则
表达芯片的标准差异分析:都是走标准分析流程,火山图,热图,GO/KEGG数据库注释等等
【04】circRNA-seq分析的一般流程
【05】circRNA_ID转化
六位数字circRNA_ID:
image.png
Agilent公司circRNA芯片我们查阅GEO数据库发现,目前经常使用的人类circRNA芯片主要有以下几种:
GPL21825:074301 Arraystar Human CircRNA microarray V2
GPL19978:Agilent-069978 Arraystar Human CircRNA microarray V1
GPL26925:Agilent-084217 CapitalBio Technology Human CircRNA Array v2
GPL23467:Agilent-082557 CBChuman circRNA array V2.0
对我们感兴趣的GSE,下载相应的GPL信息即可获得circRNA_ID,当然还有其他物种的circRNA芯片,可自行探索。
七位数字circRNA_ID:CircBase数据库
采用阿拉伯数字形式进行编码命名,如:hsa_circ_0000001(七位阿拉伯数字)
circBase数据库提供六位/七位circRNA_ID对照表,当我们需要进行ID转化时,登录http://circbase.org/cgi-bin/downloads.cgi即可下载circID与name对应关系进行转化。
Host gene+三位阿拉伯数字:Circbank数据库 当我们需要进行ID转化时,登录http://www.circbank.cn/downloads.html#即可下载circBank_id与circRNA_id对应关系进行转化。
以上就是三种主流的circRNA_ID,基本涵盖了论文中提及的ID;安捷伦circRNA芯片使用6位数ID,我们实验室测序结果使用的7位数ID,当然除此三种外,还有一些其他的circRNA_ID命名方式,欢迎各路大神补充。
【06】十行代码完成circRNA多种ID相互转换
library(data.table)
a=fread('probeMatrix.txt',data.table = F)
a[1:4,1:4]
b=read.table('ann.txt',sep = '\t',header = T)
tail(head(b,20))
d=merge(a,b,by.x='ID_REF',by.y='ID')
e=read.table('ID.txt',header = T)
head(e)
f=merge(e,d,by='circRNA')
head(f[,1:6])
网友评论