美文网首页
TCGA的样本id里藏着分组信息

TCGA的样本id里藏着分组信息

作者: 小洁忘了怎么分身 | 来源:发表于2019-02-26 14:12 被阅读3次

    分组信息是在这个id的第14-15位,01-09是tumor,10-29是normal。我拿了一个示例数据,请在生信星球公众号回复0129获取。
    根据这个生成一个分组信息它是一个向量形如


    如果在id的14-15位在1-9之间就标记tumor,10-29之间就标记normal。这里面涉及到字符串截取、数据类型转换,%in%函数以及ifelse函数(if-else循环的变体)
    将示例数据放到你的工作目录

    load(file="id.Rdata")
    table(substring(id,14,15)) #table看有多少重复值
    num <- as.numeric(substring(id,14,15)) #截取出来是字符串,要转为数字
    #屡试不爽的ifelse
    group_list=ifelse(num %in% 1:9,"Tumor","Normal")
    

    如果你要用自己的数据试试,就把样本编号命名为id,来跑一跑就ok。这一列信息后面作图会用。


    非常开心公众号粉丝到了2000

    相关文章

      网友评论

          本文标题:TCGA的样本id里藏着分组信息

          本文链接:https://www.haomeiwen.com/subject/zosayqtx.html