R way -- P5
Tips
-
读取文件时,
read.table(file = "filename" , sep = "\t" , header = T )
,- 其中
sep
是形式参数,用来指定字符的分隔符号。csv 文件是用逗号分隔的,所以sep = ","
,tsv和txt文件是以 制表符 分隔的,所以sep = "\t"
,如果有文件的是以空格分隔的,则sep = " "
- 其中
header = T
指的是导入数据时,第一行作为 列的名称,具体数据从第二行开始 ,如果header = F
指的是,第一行视为具体数据。
- 其中
-
colnames(a)
#查看 a 的列名;rownames(a)
#查看 a 的行名-
colnames(a)[1] <- "newname"
#如果左上角第一个为空,R会自动补为x,用这个命令来修改成自己想要的名字
-
-
b <- read.csv(file = "filename", sep = ",", header = T, row.names = 1)
#这行代码中最后的row.names = 1
的意思是 第一列为行名。 -
write.table(a, file = "filename2", sep = ",", quote = F)
#导出数据框。quote = F
意思是 字符串不加双引号 (默认格式带有双引号,不影响读入) -
这次没有处理完的数据下次想接着用怎么办?--学会保存和重新加载。保存的格式是
.RData。
save.image(file="bioinfoplanet.RData")
#保存镜像文件
save(X,file="test.RData")
#保存其中一个变量
load("test.RData")
#再次使用 RData 时的加载命令 -
X$列名
#可以提取列(优秀写法,而且这个命令还优秀到不用写括号的地步,并且支持Tab自动补全哦,不过只能提取一列) -
a <-data.frame(case=paste("S",1:50),values=runif(50))
# case和values 是列名。
plot(a$case,a$values)
#根据这两列的数据作图
为了避免多次输入变量a
,可有更高效的方式-
attach(a) plot(case,values)
#attach(a),就是将数据框名添加到搜索环境中,作图时就只需输入列名(连$都不用了)。detach(a)
#做完之后,将a删除出搜索环境。
局限性:两个以上数据框的列名有冲突时,同时attach会报错。
-
课后作业
原因可能是前文代码中的x与保存文件是的x的大小写不统一,造成找不到对象。
所以在命名变量时,尽量使用大小写不同的英文字母。
网友评论