美文网首页
log10数据要当心

log10数据要当心

作者: 小洁忘了怎么分身 | 来源:发表于2024-07-14 15:19 被阅读0次

基因表达芯片的数值范围是需要关注的信息。

可以从箱线图上面看出大部分的端倪。

特殊数据看过来

options(timeout = 10000)
library(tinyarray)

## tinyarray v 2.4.2  welcome to use tinyarray!
## If you use tinyarray in published research, please acknowledgements:
## We thank Dr.Jianming Zeng(University of Macau), and all the members of his bioinformatics team, biotrainee,especially Xiaojie Sun, for generously sharing their experience and codes.

a = geo_download("GSE66229")

## 54675 probes, 400 samples from 0.572611153 to 4.467523098

#因为样本数量太多,用sample抽样10个样本出来画箱线图即可。
boxplot(a$exp[,sample(1:ncol(a$exp),10)])

这个数据的范围是在0-4之间的。正常的log之后的数据范围是0~20之间,这个范围很不正常。一般是下载到了log后的数据,又给人log一次,才会这样。

但是呢,这数据下载下来就是这么个范围,并不是多余log导致的。所以我们应该去GEO网站上面找答案啊。

数据处理的细节不在GSE页面上,而是在GSM页面上,也就是说应该点开某个具体的样本来看。

破案了哦,这是log10的数据,是不可以直接使用的,你拿它计算log2FC算出来的值就非常小!

所以需要逆转一下:

exp = a$exp
exp = log2(10^exp+1)
boxplot(exp[,sample(1:ncol(a$exp),10)])

再看这个范围,已经恢复正常咯。

总结

我们并不是提前知道这个数据取了log10,而是看到数据范围在0-4之间,不太正常,所以到网页上查才查到的。

和它一样log10的数据还有一个:GSE62254。一毛一样的情况。

表达芯片的数据范围总结

zscore的数据可以用来做热图,做箱线图,做生存分析,但是一般不用来做差异分析。

相关文章

  • Excel技巧之LOG函数

    说明返回数字以 10 为底的对数。 语法LOG10(number) LOG10 函数语法具有下列参数: “数字” ...

  • qqman 学习,用来画散点图和曼哈顿图

    ylim 表示纵坐标范围,col 为颜色,logP表示是否取log10负数,ylab 表示是否要纵坐标名称。 下面...

  • semilogy()和log10()画图看起来一样

    semilogy()和log10()画图看起来一样

  • 前端零基础课程--第十五节课(Math)

    Math:数值的常用方法 属性:LOG10/LOG2/PI/.... 方法: abs(x) ceil(x)/rou...

  • 年节将至,要当心!

    年节将至,要当心! 寒假已至,春节的脚步越来越近,一件大事又要搬上日程了,敲黑板!!!我们今天来讲一下安全问题! ...

  • 当心,他们要越狱

    为了表现各种深刻的社会矛盾,体现深藏于心的复杂人性,导演们喜欢选择越狱类的题材。关于越狱的电影,比较经典的有这样几...

  • 惩罚孩子要当心

    每天下班回来检查孩子家庭作业完成是我跟儿子之间的一个约定,到点之后我也严格的去执行确认他作业的完成情况,...

  • “在外要当心,有空要联系”

    01 昨晚,老妈打来电话,唏嘘了很长时间。 集市买菜时,路遇一位一年不见的老同学,寒暄了数句,两人匆匆告别。 老妈...

  • matlab的笔记

    exp:e pi:π log10(X):以十为底的log <1> 例:x^2-2x-8=0 先要...

  • 这样的评语要当心

    当有人评论说,你的文章朴实无华真情实感。要当心 他内心的话是,真找不到什么来夸你,又不好意思骂你。

网友评论

      本文标题:log10数据要当心

      本文链接:https://www.haomeiwen.com/subject/kljchjtx.html