学习生信的第五天,今天进一步学习了R语言,每天都能学到新知识真的好开心!!
首先,梳理一下关于学习R语言的几个易错知识点:
1.R的赋值符号不是等号,而是<-;
2.在 console控制台输入命令,相当于Linux的命令行;
3.R的代码都是带括号的,括号必须是英文的;
4.显示工作路径 getwd();
5.向量是元素组成的,元素可以是数字或字符串;
6.表格在R语言中改名叫数据框;
7.函数或命令不会用时,除了百度/谷歌搜索以外,用命令查看帮助?read.table调出对应的帮助文档。
R语言中的数据类型有向量(vector),矩阵(matrix),数组(array),数据框(data frame),list。其中向量和数据框很重要!!!
向量
向量.png数据框
读取本地数据
读取数据框
x<-read.csv(‘example.txt’)
sep,header是比较常用的参数
read.table(file = "example.txt",sep = "\t",,header =T)
a <- read.table(file = "example.txt",sep = "\t",,header =T)
设置行名和列名
数据框并不需要改,若改了需要撤销,只需用read.table命令重新赋值一遍,记住大小写是严格区分的
X <- read.csv('example.txt')
colnames(X) 查看列名
rownames(X)查看行名,默认值的行名就是行号,1,2,3,4
colnames(X)[1] <- "bioplanet" 返回数据,修改列名
X<-read.csv(file = "example.txt",sep = " ",header =T,row.names=1)最后row.names的意思修改第1列为行名
数据框的导出
write.table(X,file = "yi.txt",sep = ",",quote=F)字符串不加双引号,分隔符改为逗号
变量的保存与重新加载
保存格式是RData
save.image(file="bioinfoplanet.RData")保存当前所有的变量
save(X,file="test.RData")保存其中一个变量
load("test.RData")再次使用数据框的加载命令
提取元素
类似X[x,y]第x行第y列,比较好理解,不做过多解释
直接使用数据库中的变量
提取某两列作散点图:
options(stringsAsFactors = T)
a <-data.frame(case=paste0("S",1:9),values=runif(9))
plot(a$case,a$values)
这里有两种高效方法:
1.attach 将数据框添加到搜索环境中
attach(a)
plot(case,values)
detach(a) 删除搜索环境
局限性就是两个以上数据框的列名有冲突时,attach会报错
2.with 变量添加到当前环境,把所有操作都限制在数据框,修改原始数据,这里要注意with函数做多个参数时,每个新修改的代码都需要换行,否则会报错,这里若是不分行可用分号代替。
with(a,{plot(case,values);x<<-summary(values)}) 求和并赋值给x,<<是作为全局变量。
这里强调一下,with和transform的用法比较:
创建数据框data,x1和x2是data的两个列向量
data <- data.frame(x1 = c(2, 2, 6, 4), x2 = c(3, 4, 2, 8))
利用transform函数对数据框data增加两个变量(列向量)sumx和meanx,并把结果存储在数据框data中
data <- transform(data, sumx = x1 + x2, meanx = (x1 + x2)/2)
利用with函数,expr表达式执行一条语句占一行,执行多条语句需要换行
data <- with(data, {sumx = x1 + x2
meanx = (x1 + x2)/2})
或者多条语句在同一行,则中间应当用分号;隔开
data <- with(data, {sumx = x1 + x2; meanx = (x1 + x2)/2})
总结:transform函数只能用于数据框改变,而with函数应用更宽泛一些,可以用于除数据框之外的数据对象的改变。
R语言中expr表达式执行一条语句占一行,执行多条语句需要换行;如果需要多条语句在同一行,则中间应当用分号;隔开。
transform(数据框名, 对数据框的一系列修改),这些修改中间用逗号分隔,别换行。
with(数据框名, {修改1;修改2;修改3;......})或者within(数据框名,{修改1
修改2
修改3})
最后,解释今天的作业,save(X,file="test.RData")这句代码如果报错object X not found,是为什么,应该怎么解决?
答案就是字母的大小写,前面赋值的是x,所以保存X的值找不到。
网友评论