今天的课好难呀,学的有点吃力。几个注意点:
-
?read.table
产看帮助文档 - 1.理解元素、标量、向量的概念
元素可以是数字、字符串、字母等,字符串要用英文状态下的双引号引起来;
标量
是指一个元素组成的变量;向量
是指多个有序排列的元素组成的变量;
补充:脚本窗口的打开:通常脚本窗口时隐藏的,可通过点击文件下拉菜单,选择“新建文件”-“R脚本”来打开此隐藏窗口。
- 常用R语言
x<- c(1,2,3)
回车后出现 1 2 3,该命令意为将x定义为由元素1,2,3组成的向量。
x<- 1:10
该命令意为从1-10之间所有的整数
x<- seq(1,10,by = 0.5)
该命令意为1-10之间每隔0.5取一个数
x<- rep(1:3,times=2)
该命令意为1-3之间所有的整数, 重复2次
x[4]
第4个元素;x[2:4]
第2到4个元素;
x[-4]
除了第4个元素之外剩余的元素
x[-(2:4)]
除了第2-4个元素;
x[c(1,5)]
第1个和第5个元素;
x[x==10]
等于10的元素; 这是2个等号哦;
x[x<0]
小于0的元素;
x[x %in% c(1,2,5)
a %in% table表示存在于table中的a;
重要内容
1.查看本地数据
read.csv(file="XX.txt")
是指将文件以数据框(表格)形式打开同时创建一个数据框;
read.table(file="xxx.txt",seq=''\t'',header=T)
表示将xxx.txt文件以数据框形式打开,各元素之间用空格分隔开(/t或者直接空格都一样),header=T表示是否将第一行作为列名,是选择T,false则第一行即为具体数据)。read.csv()函数默认为head=T。
2.查看及修改行号、列数
colnames(变量名)
查看列名;
rownames(变量名)
查看行名;
colnames(X)[1]<-"haha"
将变量X第一列名称改为haha;
row.names=1
表示将第1列的元素作为行号;
3.导出数据框
write.table(X,file = "yu.txt",sep = ",",quote=F)
将变量X相关元素导出为表格的形式,命名为yu.txt,各元素之间用,隔开,quote=F表示各字符串不加双引号,quote=T表示各字符串要加双引号,默认是quote=T的状态)
4.数据的保存与重新加载
save.image(file="taotao.RData ")
意为将当前全部变量保存至taotao.RData文件,注意文件后缀为RData;
save(X,file=" taotaoA.RData")
将变量X保存为taotaoA.RData;
load("taotao.RData")
加载taotao.RData文件显示其数据;
5.提取元素
- X[x,y] 第x行第y列 X[x,] 第x行 X[,y] 第y列
- X[y] #也是第y列;
- X[a:b] 第a列到第b列
- X[c(a,b)] 第a列和第b列
- X$列名#也可以提取列(此时可以tab键自动补齐)
注意:第5条是在变量X的状态下查看的,如果变量赋名为a,替换即可。
6.直接使用数据框中的变量
options(stringsAsFactors = T)
a <-data.frame(case=paste0("S",1:9),values=runif(9))
plot(a$case,a$values)
环境设置函数为options(),stringsAsFactors=Fasle意思为防止导入数据任何因子的转换,=T则相反;
paste0与paste函数,前者是指返回无空格的对象,具体可见20190506-R语言字符处理函数paste、paste0一文。例子可见:
xx<-c("ac","bg")
paste(xx,1:2)
[1] "ac 1" "bg 2"
paste0(xx,1:2)
[1] "ac1" "bg2"
不想多次输入变量名可使用下列方法(还是刚才那个变量a为例哈):
- attach(a),plot(case,values)。做完后将a删除出搜索环境 detach(a)。这种方法的局限性:两个以上数据框的列名有冲突时,同时attach会报错。
- 用with函数,我觉得没怎么懂
最后,记得清除所有变量哈 rm(list = ls())
文中代码引用自生信星球,在此感谢。
网友评论