美文网首页
生物信息学数据挖掘学习笔记

生物信息学数据挖掘学习笔记

作者: jiarf | 来源:发表于2021-01-07 20:46 被阅读0次

教程https://www.bilibili.com/video/BV1JE411g7pr

image.png
image.png image.png image.png

芯片质量分析图


image.png

所有样本的基线处于一个0的水平线上
RNA降解图,这样的图就表明芯片质量很好


image.png

每个圆圈大小不一样:大:更多差异基因富集在这个上,颜色越深,表明更大程度的富集 image.png

差异基因上下游之间关系


image.png

共表达,,不同颜色代表一个模块,,找到所感兴趣的模块,与临床信息做比对,确定哪一个模块

如何利用GEO数据库对芯片简单分析

image.png
image.png image.png

10个样本做基因芯片,叫系列series,用什么手段检测样本的基因表达量,就是平台,


image.png

确定数据类型:基因芯片、甲基化、等等


image.png
image.png
image.png
image.png
image.png
image.png
image.png

要把这些差异基因下载下来的话要复制粘贴就可以了,但有些没有基因名字,这些基因删掉就可以了


image.png
把基因芯片检测到的所有基因都做成一个表格,包含有差异和无差异的
image.png
要保存,,复制粘贴跟前面不一样‘
image.png
打开excel,粘贴,这时所有数据都搞在第一列,这时需要分开放在不同的列里面
选中第一列------数据---分列--固定宽度
--固定宽度
image.png
没有分开的单击一下就行了,下一步完成既可以了,去除分号,替换成空格

数据的中位数在同一个水平线上

制作热图,


image.png

GEO在线工具制作热图
只有有热图的项目才可以做热图
芯片质量评估、R


image.png
左上灰色分布图,,,灰色均一,
2 白色灰色权重较高,权重随机分布,分布均匀

3.残差点:点随机分布,,绿红蓝点随机分布,质量可以过关


image.png
1.做RLE比较简单
image.png
都要在0
2.做NUSE
image.png
image.png
中心处于一致水平接近于1
image.png
5端开始降解,若斜率很低和很高,,降解多,芯片质量有问题

r分析

image.png
image.png
下载原始数据

残差图、权重图

image.png
image.png

RLE

image.png

NUSE

image.png

RNA降解图

image.png

数据下载和预处理

GEO数据库里真正下载的是三个文件,平台文件、SERIES MATRIX FILE、RAW.tar


image.png

平台的话点进去,拉到最下面


image.png

点击如图,如果download不一定有的话,,点下面那个ANNOTATION SOFT table也可以的

相关文章

网友评论

      本文标题:生物信息学数据挖掘学习笔记

      本文链接:https://www.haomeiwen.com/subject/rsttbktx.html