美文网首页R语言学习
关于学徒作业的检查

关于学徒作业的检查

作者: 晓颖_9b6f | 来源:发表于2020-12-02 00:36 被阅读0次

    1、《公共数据辅助乳腺癌的免疫治疗机制研究》

    ##Step3. 读取基因表达信息
    ###读入表达数据
    expr <- read.table("HiSeqV2",sep = "\t",header = T, stringsAsFactors = F)
    rownames(expr) <- expr[,1]
    expr <- expr[,-1]
    grep("btn3a3",rownames(expr),ignore.case = T)
    
    ##Step4. 画图:BTN3A3基因在TNBC和Non-TNBC中的表达量
    phe$BTN3A3 <- df[phe$sampleID,1]
    library(ggpubr)
    

    在这里,还没有这里,还没定义df,后面step4就用了df
    应该添加:

    df <- as.data.frame(t(expr[20274,]))    
    

    2、《有生物学意义的复杂热图》

    在用limma包做差异分析的时候,做好了差异分析,但是没有顺着往下画个图,还是建议还是画个火山图什么的
    建议添加:

    log2FoldChange <- tT_all$logFC
    FDR <- tT_all $adj.P.Val
    plot(log2FoldChange, -log10(FDR), pch = 20)  
    

    5、《热图韦恩图GO富集分析图》

    韦恩图做的,好像出了问题,做出的韦恩图重叠在前面做的热图上面,而不是自己成新的一张图片。 ----出来的图只能保存?不能直接在R上面看到?奇怪
    怎么做呢???
    用的是:grid.draw(venn.plot) 这是用来画底层图的呀?
    原代码:

    #韦恩图
    ## PD-L1敲除后下调的基因与RIP-seq的重叠基因
    library("VennDiagram")
    #两个基因列表
    VENN.LIST=list(RNA_seq = RNA_seq$`gene name`,
                   RIP = RIP$`Gene name`)
    venn.plot <- venn.diagram(VENN.LIST, NULL,
                              fill=c("RoyalBlue", "Salmon"), 
                              alpha=c(0.8,0.8), 
                              cex = 2,cat.cex=1.5)
    grid.draw(venn.plot) 
    
    image.png

    7《肿瘤异质性+免疫浸润细胞数据挖掘》

    ①.这个跑不通?

    p_sur1 <- ggsurvplot(sfit,palette = c("#E7B800", "#2E9FDF"),
                         risk.table =TRUE,pval =TRUE,
                         xlab ="Time in months",
                         ggtheme =theme_light()) +
      labs(title = "TCGA whole cohort")
    

    产生的错误: Warning message:
    Vectorized input to element_text() is not officially supported.
    Results may be unexpected or may change in future versions of ggplot2.
    ---删除前面的p_sur1 <-就可以了???
    p_sur1 +geom_point()

    又是先在R那里看不到图片,然后保存之后,在文件夹里面才能看到.

    9《细胞种类分析》

    1、什么时候进行log2处理,什么时候用log10处理?他俩之间的区别是什么?好像之前做的那些,好像一般都是用log2处理?
    作业中,两种处理都用了

    data<- cbind(log10(a[,1:4]),a[,c(5,6,8)])
    .....
    data1<- cbind(log2(a[,1:4]+1),a[,c(5,6,8)])
    

    2、作图的时候,建议可以看看做成什么样子了,再往下做

    ph1<- ggplot(data,aes(x=LP, y=BC,color=BCvsLP))+geom_point()+scale_color_brewer(type='qual',palette=2)
    ph2<- ggplot(data,aes(x=LP, y=LC,color=LCvsLP))+geom_point()+scale_color_brewer(type='qual',palette=2)
    ph3<- ggplot(data,aes(x=LC, y=BC,color=BCvsLC))+geom_point()+scale_color_brewer(type='qual',palette=2)
    

    可以先 ph1 +geom_point()--看看画成什么样子先.

    10《TCGA数据辅助甲基化区域的功能研究》

    这里跑不通

    res <- ConsensusClusterPlus(d=methy,maxK = 4, reps = 1000, 
                                pItem = 0.8, pFeature = 0.8, 
                                clusterAlg = "km", distance = "euclidean") #按文章中的参数设置
    

    显示的错误是
    Error in do_one(nmeth) : 外接函数调用时不能有NA/NaN/Inf(arg1)
    但是前面已经通过"methy[is.na(methy)] <- 0",去掉NA值了呀,???
    na.fail(methy) 检查也是没有NA值的了.

    13<多分组差异分析结果热图>

    1.这一段代码跑不通

    query <- GDCquery(project = "TCGA-SARC",
                      data.category = "Transcriptome Profiling",
                      data.type = "Gene Expression Quantification", 
                      workflow.type = "HTSeq - Counts")
    

    Error in value[3L] :
    GDC server down, try to use this package later

    隔一段时间,再跑几次就可以跑出来的了

    2、这段循环的代码有点看不懂呀

    group_list <- c()
    for( i in 1:length(subtype)){
      tmp<- ifelse(clinic$short.histo==subtype[i],subtype[i],'other')
      group_list<- cbind(group_list,tmp)
      colnames(group_list)[i] <- subtype[i]
    }
    

    group_list <- c()

    14<如果传统bulk转录组数据队列足够大也可以使用单细胞流程>

    1/这段跑不通,电脑hold不住

    sce <- ScaleData(object = mca, 
                     vars.to.regress = c('nCount_RNA'), 
                     model.use = 'linear', 
                     use.umi = FALSE)
    

    Regressing out nCount_RNA
    错误: 无法分配大小为36.0 Gb的矢量

    设置过滤了很多,还是跑不通吗?

    mca <- CreateSeuratObject(counts =  mca.matrix, 
            meta.data =mca.metadata,
            min.cells = 5,           少于5个细胞覆盖的基因(min.cells = 3)被过滤掉
           min.features = 1000,    数据集中测到的少于200个基因的细胞(min.features = 200)
        project = "sce")   或者project = "MouseCellAtlas"
    

    Regressing out nCount_RNA
    | | 0%错误: 无法分配大小为6.9 Gb的矢量

    学徒作业16《 [乳腺癌的IHC分类和PAM50分型的差异情况]》

    1/ image.png

    这里应该不是剩下222个病人吧,是剩下 747个病人吧.(作业里面是这样写的)
    但是我用"length(unique(dat$id))"看了一下,怎么是722个?

    相关文章

      网友评论

        本文标题:关于学徒作业的检查

        本文链接:https://www.haomeiwen.com/subject/yzmbiktx.html