首先复习一下一个重要命令
help()
或者?
,可以查询不会的函数。
rm(list = ls())
,清除所有环境中的变量。
下面开始今天的学习,
向量
-
标量和向量的区别
摘自生信星球
元素指的是数字或者字符串(用chr表示)等,根据它可以区分两个词:
标量:一个元素组成的变量
向量:多个元素组成的变量
总结一下就是标量是一个字符或数字,向量是一堆。
做以下练习
x<-c(1,2,3)
#常用的向量定义写法,意为将x定义为由元素1,2,3组成的向量。
x<-(1:10)
#从1-10之间所有的整数
x<-seq(1,10,by = 0.5)
#1-10之间每隔0.5取一个数(注意这里是逗号不是分号)
x<-rep(1:3,times=2)
#1-3 重复2次
体会:x<-c(1,2,3)
与x<-(1:10)
含义相同,都是赋值。都可以用x(2)
函数查看。
x<-seq(1,10,by=0.5)
这个命令只能是,
不能写成:
。
x<-rep(1:3,times=2)
这个命令只能是:
,不能是,
。
-
从向量中提取元素
- 根据元素的位置, 代码引用生信星球。
x[4] #x第4个元素
x[-4]#排除法,除了第4个元素之外剩余的元素
x[2:4]#第2到4个元素
x[-(2:4)]#除了2到4之外的元素
x[c(1,5)] #第1个和第5个元素
注意这个地方是[]
不是()
,查看X值,View()
中V必须大写。查看向量中的某个元素,需要加c
。
2.根据值得大小。
Snipaste_2018-10-26_19-37-43.pngx[x==10]#等于10的元素
x[x<0] #小于0的元素
x[x %in% c(1,2,5)]#存在于向量c(1,2,5)中的元素
x[x==10]
与x[x=10]
一样的效果。
数据框
-
读取本地数据
read.table(file = "huahua.txt",sep = "\t",header =T) #读取文件,分隔符为Tab,有表头
a<-read.table(file = "huahua.txt",sep = "\t",header =T)#把这个数据框赋给一个变量a
\t 的意思是 横向跳到下一制表符位置
read_csv 默认分割是逗号
read_table 默认分割是\t
-
设置行名和列名
X<-read.csv('doudou.txt') #在示例数据里有doudou.txt 注意这里的变量X是一个数据框
colnames(X) #查看列名
rownames(X) #查看行名,默认值的行名就是行号,1.2.3.4...
colnames(X)[1]<-"bioplanet"#有的公司返回数据,左上角第一格为空,R会自动补为x,用这个命令来修改
X<-read.csv(file = "huahua.txt",sep = "\t",header =T,row.names=1)#最后row.names的意思是修改第一列为行名
colnames(X)[1]<-"doudou"
的意思是修改第一格为doudou
colnames(X)[2]<-"huahua"
的意思是修改第二格为huahua
这里一直想让第二列为行名,结果一直没有实现,花花指导后明白或者默认第一列为行名或者没有行名。。。
-
数据框的导出
Snipaste_2018-10-26_21-56-28.pngwrite.table(X,file = "yu.txt",sep = ",",quote=F)#分隔符改为逗号,字符串不加双引号(默认格式带由双引号)
如果去掉quote=F,除了数值外都加了双引号。
-
变量的保存和重新加载
这次没有处理完的数据下次想接着用怎么办?--学会保存和重新加载。保存的格式是RData。
save.image(file="bioinfoplanet.RData")#保存当前所有变量
save(x,file="x1.RData")#保存其中一个变量
load("x1.RData")#再次使用RData时的加载命令
这个地方卡了很久,因为花花的frame1把我搞蒙了,我以为是什么函数。。。。
Snipaste_2018-10-26_22-37-58.png
- 提取元素
X[x,y]#第x行第y列
X[x,]#第x行
X[,y]#第y列(横着写,这是不够懒也不够优秀却能存在的写法)
X[y] #第y列(竖着写,这是懒惰又优秀的写法)
X[a:b]#第a列到第b列
X[c(a,b)]#第a列和第b列
X$列名#也可以提取列(优秀写法,而且这个命令还优秀到不用写括号的地步,并且支持Tab自动补全哦,不过只能提取一列)
这里花了更长时间,今天有点不在状态呢。把[]写成(),折腾了一个小时。
**x[1:3]
指1到3列,如果要提取1到3行,x[1:3,]
。
- 提取某两列做散点图
c <-data.frame(case=paste("S",c(1:50)),values=runif(50))
plot(c$case,c$values)
case和values单纯为变量,科普了下paste函数
它可以将任意数量的参数组合在一起。
语法
粘贴(paste)函数的基本语法是:
paste(..., sep = " ", collapse = NULL)
以下是所使用的参数的说明:
... 表示要组合的任何数量的参数。sep- 表示参数之间的分隔符。它是任选的。
collapse - 用于消除两个字符串之间的空间。但不是在一个字符串的两个词的空间。
一直没明白s是什么意思,忽然看图发现是横坐标。R语言好难。。。很多百度搜不到啊!各种猜谜。
想使用刚才自己的x变量中提取第一和第二列作图。
c<-data.frame(x1=paste("s",x[,1],x2=x[,2]))
plot(c$x1,c$x2)
画出图形为
Snipaste_2018-10-27_00-07-11.png
虽然很丑,但很高兴。
-
attach和with用法
在R语言中,对于串列,数据框中的数据的进行操作时,为了避免重复地键入对象名称,可使用attach或with。
1、attach()
假设data.frame包含列name,age
attach(onedata.frame)后就可以引用直接引用onedata.frame中的元素了,例如:
(1)创建测试数据框
name<-c("Zhangshan","Lisi","Wangwu","Zhaoliu")
age<-c(20,30,40,50)
onedata.frame<-data.frame(name,age)
onedata.frame
name age
1 Zhangshan 20
2 Lisi 30
3 Wangwu 40
4 Zhaoliu 50
(2)attach测试
attach(onedata.frame)
The following objects are masked by .GlobalEnv:
age, name
age
[1] 20 30 40 50
name
[1] "Zhangshan" "Lisi" "Wangwu" "Zhaoliu"
detach(onedata.frame)
name
错误: 找不到对象'name'
可见,访问数据框中的元素只在命令attach()和detach()之间可以搜索到。
2、with()
使用with,类似Javascript中的with,在括号中有效。例如:
with(onedata.frame,{
name
})
[1] Zhangshan Lisi Wangwu Zhaoliu
Levels: Lisi Wangwu Zhangshan Zhaoliu
用with有个问题就是里面设置的变量在外部无法访问:
with(onedata.frame,{name1<-name})
name1
错误: 找不到对象'name1'
解决办法就是使用<<-赋值符号,例如:
with(onedata.frame,{name1<<-name})
name1
[1] Zhangshan Lisi Wangwu Zhaoliu
Levels: Lisi Wangwu Zhangshan Zhaoliu
--------------------- 作者:hongweigg
来源:CSDN
原文:https://blog.csdn.net/hongweigg/article/details/48093577
今天学习结束,感觉有点难。
思维导图
初学数据集.png
网友评论