1.图表介绍
(1) 热图
1- 差异基因热图
group: 粉红色untrt为对照组
中线以上的基因为下调基因
(2)散点图
2- 以一个向量作为纵坐标,横坐标默认按照下标排序
(3)箱线图
3-
箱线图展示单个基因在两组之间表达量的差异
一组数据分布的直观体现,展示数据群体数据整体分布,不展示每一个数据的样子
输入数据是一个数值型向量作为纵坐标和一个字符串向量(有重复值且取值数量有限)作为横坐标
4
离群点:比Q1小1.5倍的四分位距(箱高)或比Q3大1.5倍四分位距的点
max: 最大值
75%: Q3,四分之一的数比我大
median: Q2,中位数(Q1、Q2、Q3统称为四分位数)
25%: Q1, 四分之一的数比我小
min: 最小值
(4)火山图
5 6 7- P值越小 → -log10(Pvalue)越大 → 差异越显著
(5)主成分分析
8- 一个点代表数据框中的一行,点与点之间的距离代表相似性,距离越近越相似(Dim1,Dim2代表主成分1和主成分2能解释数据变化趋势的百分之多少,后面的百分数可以去掉不用显示)
2.表达芯片分析思路
- 探针的表达量反应基因的表达量
探针注释(探针与基因的对应关系)
- 注释来源
1) Biocoductor的注释包
2)GPL的soft文件解析
3)官网下载对应产品的注释表格
4)自主注释
https://mp.weixin.qq.com/s/mrtjpN8yDKUdCSvSUuUwcA
3.富集分析
(1)id转换:bitr()
entrezid id是富集分析最好的基因id
- 输入数据:
差异基因的entrezid id
所有基因的entrezid id
网友评论