link:http://ccb.jhu.edu/chess/
what's CHESS?
CHESS是一个基于GTEx计划通过测10000条RNA序列得到的人类基因数据集。CHESS包含了20352编 protein-coding genes,18887 lncRNA genes 还有抗体和其它RNA基因。在2.2版本中,包括了42611个基因和323258个转录本,这些转录本中,有266331为亚型编码基因,剩下的是非编码RNA。
CHESS囊括了2017年前的参考序列的几乎全部基因和编码基因。而且还新增了jhu在18年发现的224个protein-coding genes和2671个lncRNA genes。
A note about fusion genes
融合基因是又来自两条不同染色体的两个基因粘在一起组成的突变基因,或者是在同一条染色体上正常情况下不相邻的区域,通过突变连接到一起的的突变基因。这些不正常的基因通常都是收录在融合基因数据集仲,而由于它们不在正常的基因组(非突变)中出现,所以就把这些融合基因收录到CHESS内。

网友评论