美文网首页geo相关
如何判断你的GEO数据中的count值是否为log后的

如何判断你的GEO数据中的count值是否为log后的

作者: 致知_5974 | 来源:发表于2019-10-21 11:19 被阅读0次

我下载了4个GEO乳腺癌的数据集,想要把它们整合为一个数据集,在获取了表达矩阵,提取了想要的数据,并且注释了探针名后,我想,终于可以整合了,然后,我就遇到了问题。
除了其中一个矩阵表达量都在3000左右,一看就需要log,其他的好像都是log后的。
怎样批量判断是否需要log化呢?
我就回去翻了果子老师的视频,发现了一段代码


# 自动log化
ex <- exprSet
qx <- as.numeric(quantile(ex, c(0., 0.25, 0.5, 0.75, 0.99, 1.0), na.rm=T))
LogC <- (qx[5] > 100) ||
  (qx[6]-qx[1] > 50 && qx[2] > 0) ||
  (qx[2] > 0 && qx[2] < 1 && qx[4] > 1 && qx[4] < 2)

if (LogC) { 
  ex[which(ex <= 0)] <- NaN
  exprSet <- log2(ex)
  print("log2 transform finished")
  }else{
    print("log2 transform not needed")
    }

用这个段代码批量处理了我的四个数据集,发现一个需要log2,其他三个都不需要。
然后log2一个表达矩阵就好了~
然后我还有两个问题没有解决:
所有的GEO数据库里的log都是取得log2吗?就没有哪个哥们想要log10一下?是不是值之间的差异就太小了?
第二,如何根据GSE号追溯回源文章呢?根据citation的好像不对啊
遇到的问题好多,要一点一点来了~
感悟:遇不到问题,是真的不会去好好看视频做笔记的,哎。。。。

相关文章

  • 如何判断你的GEO数据中的count值是否为log后的

    我下载了4个GEO乳腺癌的数据集,想要把它们整合为一个数据集,在获取了表达矩阵,提取了想要的数据,并且注释了探针名...

  • 自定制处理条件_用户名是否存在

    一、单个值处理判断 不推荐用法, form判断和字段判断相分离 用count判断数据是否唯一urser = mo...

  • null和空字符串('')的区别

    在Java开发中,我们需要常常判断是否值为null,尤其在xml数据交互过程中,我们判断某一个报文的值是否为nul...

  • pandas学习笔记之缺失值处理

    对于数据中的缺失值,有两种处理思路: 删除 插补 如何判断数据中是否存在缺失值? pd.isnull(df) ->...

  • python中pandas库之null值和numpy库之0

    null值,即为缺失数据。 1 判断是否为NAN 2 删除nan值 3 填充数据 4 处理为0的数据

  • Mysql操作记事本

    在mysql中做统计的时候,count()会扫描所有的行数,不管行的值是否为空,count('column nam...

  • unset/array_unique/array_filter

    从几个小技巧说起 判断一个数组是否有重复值:count($array) == count(array_unique...

  • JS精粹

    1. 基本数据 1.1 判断a是否为NaN 1.2 判断为false的值 false null undefined...

  • 基础Sql语句之二

    汇总数据 以上函数均忽略列值为null的行,除了 count(*),其会对表中行的数目进行计数,不管列中包含的是否...

  • collections 模块的使用

    判断数据类型 1、Hashable 判断是否可哈希,即是否有哈希值,即是否为可变对象可变对象没有哈希值,不可变对象...

网友评论

    本文标题:如何判断你的GEO数据中的count值是否为log后的

    本文链接:https://www.haomeiwen.com/subject/ahttvctx.html