上一篇我们介绍了CCLE数据库,里面涵盖了上千种细胞系基因表达谱以及甲基化等信息,今天我们介绍他的“data”。
点击上方的“data”,我们看到跳出的页面是对该数据库的浏览,包括“Current data”,“Previous Releases”和“Legacy data”。
“Current data”里面包含很多原始数据,如Seq测序数据以及甲基化数据。但是很多信息都是更新到2019年,后面有对该条信息的描述,同样“Download”方便我们下载该数据。
“Previous data”,很多数据更新都是停留很早的时间。里面有miRNA,甲基化等信息。
“Legacy data”涵盖测序数据,我们点击“DNA Copy number”,Affymetrix SNP6.0阵列。原始Affymetrix CEL文件被转换为每个探针集的单个值,代表一个SNP等位基因或一个拷贝数探针。然后根据估计探针集特定线性校准曲线推断拷贝数,然后用最相似的单倍型图正常样本进行归一化。使用循环二进制分割(CBS)算法对归一化的log2比值(特别是log2(CN/2))进行分割。“mRNA expression”,Affymetrix U133+2阵列。原始Affymetrix CEL文件使用鲁棒多数组平均(RMA)转换为每个探针集的单个值,并使用分位数归一化进行归一化。摘要使用原始的Affymetrix U133+2cdf文件或重新定义的自定义CDF文件(ENTREZG-v15)。“Cell line Annotation”,细胞系注释。“Oncomap mutation”,使用Oncomap 3.0 core对33个基因(381个特异性突变)的突变进行了评估。“Hybrid capture sequencing”:1651个基因的突变和indels列表,通过大规模平行测序确定。注意:杂交捕获过程可能会在目标列表之外的基因中产生序列;这些被保存在分析中,这些基因的突变出现在下面的文件中。“Pharmacological Profiling ”:跨越504个细胞系的24种抗癌药物的药理学特征。在进行耐药实验时,想对某靶点进行药物实验时,可以在这里查询在细胞系中的IC50值。
注:
need-to-insert-img
好了,第二节关于“DATA”今天介绍完毕··下一周我们将利用CCLE数据库绘制基因表达谱。
咱们下次再见。
网友评论