1、《公共数据辅助乳腺癌的免疫治疗机制研究》
##Step3. 读取基因表达信息
###读入表达数据
expr <- read.table("HiSeqV2",sep = "\t",header = T, stringsAsFactors = F)
rownames(expr) <- expr[,1]
expr <- expr[,-1]
grep("btn3a3",rownames(expr),ignore.case = T)
##Step4. 画图:BTN3A3基因在TNBC和Non-TNBC中的表达量
phe$BTN3A3 <- df[phe$sampleID,1]
library(ggpubr)
在这里,还没有这里,还没定义df,后面step4就用了df
应该添加:
df <- as.data.frame(t(expr[20274,]))
2、《有生物学意义的复杂热图》
在用limma包做差异分析的时候,做好了差异分析,但是没有顺着往下画个图,还是建议还是画个火山图什么的
建议添加:
log2FoldChange <- tT_all$logFC
FDR <- tT_all $adj.P.Val
plot(log2FoldChange, -log10(FDR), pch = 20)
5、《热图韦恩图GO富集分析图》
韦恩图做的,好像出了问题,做出的韦恩图重叠在前面做的热图上面,而不是自己成新的一张图片。 ----出来的图只能保存?不能直接在R上面看到?奇怪
怎么做呢???
用的是:grid.draw(venn.plot) 这是用来画底层图的呀?
原代码:
#韦恩图
## PD-L1敲除后下调的基因与RIP-seq的重叠基因
library("VennDiagram")
#两个基因列表
VENN.LIST=list(RNA_seq = RNA_seq$`gene name`,
RIP = RIP$`Gene name`)
venn.plot <- venn.diagram(VENN.LIST, NULL,
fill=c("RoyalBlue", "Salmon"),
alpha=c(0.8,0.8),
cex = 2,cat.cex=1.5)
grid.draw(venn.plot)
image.png
7《肿瘤异质性+免疫浸润细胞数据挖掘》
①.这个跑不通?
p_sur1 <- ggsurvplot(sfit,palette = c("#E7B800", "#2E9FDF"),
risk.table =TRUE,pval =TRUE,
xlab ="Time in months",
ggtheme =theme_light()) +
labs(title = "TCGA whole cohort")
产生的错误: Warning message:
Vectorized input to element_text()
is not officially supported.
Results may be unexpected or may change in future versions of ggplot2.
---删除前面的p_sur1 <-就可以了???
p_sur1 +geom_point()
又是先在R那里看不到图片,然后保存之后,在文件夹里面才能看到.
9《细胞种类分析》
1、什么时候进行log2处理,什么时候用log10处理?他俩之间的区别是什么?好像之前做的那些,好像一般都是用log2处理?
作业中,两种处理都用了
data<- cbind(log10(a[,1:4]),a[,c(5,6,8)])
.....
data1<- cbind(log2(a[,1:4]+1),a[,c(5,6,8)])
2、作图的时候,建议可以看看做成什么样子了,再往下做
ph1<- ggplot(data,aes(x=LP, y=BC,color=BCvsLP))+geom_point()+scale_color_brewer(type='qual',palette=2)
ph2<- ggplot(data,aes(x=LP, y=LC,color=LCvsLP))+geom_point()+scale_color_brewer(type='qual',palette=2)
ph3<- ggplot(data,aes(x=LC, y=BC,color=BCvsLC))+geom_point()+scale_color_brewer(type='qual',palette=2)
可以先 ph1 +geom_point()--看看画成什么样子先.
10《TCGA数据辅助甲基化区域的功能研究》
这里跑不通
res <- ConsensusClusterPlus(d=methy,maxK = 4, reps = 1000,
pItem = 0.8, pFeature = 0.8,
clusterAlg = "km", distance = "euclidean") #按文章中的参数设置
显示的错误是
Error in do_one(nmeth) : 外接函数调用时不能有NA/NaN/Inf(arg1)
但是前面已经通过"methy[is.na(methy)] <- 0",去掉NA值了呀,???
na.fail(methy) 检查也是没有NA值的了.
13<多分组差异分析结果热图>
1.这一段代码跑不通
query <- GDCquery(project = "TCGA-SARC",
data.category = "Transcriptome Profiling",
data.type = "Gene Expression Quantification",
workflow.type = "HTSeq - Counts")
Error in value[3L] :
GDC server down, try to use this package later
隔一段时间,再跑几次就可以跑出来的了
2、这段循环的代码有点看不懂呀
group_list <- c()
for( i in 1:length(subtype)){
tmp<- ifelse(clinic$short.histo==subtype[i],subtype[i],'other')
group_list<- cbind(group_list,tmp)
colnames(group_list)[i] <- subtype[i]
}
group_list <- c()
14<如果传统bulk转录组数据队列足够大也可以使用单细胞流程>
1/这段跑不通,电脑hold不住
sce <- ScaleData(object = mca,
vars.to.regress = c('nCount_RNA'),
model.use = 'linear',
use.umi = FALSE)
Regressing out nCount_RNA
错误: 无法分配大小为36.0 Gb的矢量
设置过滤了很多,还是跑不通吗?
mca <- CreateSeuratObject(counts = mca.matrix,
meta.data =mca.metadata,
min.cells = 5, 少于5个细胞覆盖的基因(min.cells = 3)被过滤掉
min.features = 1000, 数据集中测到的少于200个基因的细胞(min.features = 200)
project = "sce") 或者project = "MouseCellAtlas"
Regressing out nCount_RNA
| | 0%错误: 无法分配大小为6.9 Gb的矢量
学徒作业16《 [乳腺癌的IHC分类和PAM50分型的差异情况]》
1/ image.png这里应该不是剩下222个病人吧,是剩下 747个病人吧.(作业里面是这样写的)
但是我用"length(unique(dat$id))"看了一下,怎么是722个?
网友评论