数据结构
数据类型
- <-赋值符号
- 显示工作路径get()
- 命令查看帮助:?read.table
Part1: 向量
1.标量和向量的区别
标量:一个元素组成的变量
向量:多个元素组成的变量(一个向量是一排有序排列的元素)
2.从向量中提取元素
(1) 根据元素位置
#x是赋值的变量名
x [4] #x第4个元素
x [-4] #排除法,除了第4个元素之外剩余的元素
x [2:4] #第2到4个元素
x [-(2:4)] #除了第2-4个元素
x [c(1,5)] #第1个和第5个元素
(2) 根据值
x [x==10] #等于10的元素
x [x<0]
x [x %in% c(1,2,5)] #存在于向量c (1,2,5)中的元素
Part2:数据框
header: 逻辑值,指示文件的第一行是否包含变量名,header设置TRUE,则要求第一行要比数据列的数量少一列。
sep:分开数据的分隔符。默认sep="",函数可以将1个或多个空格、tab制表符、换行符或回车符作为分隔符。
(1)读取本地数据
read.table(file = "young.txt",sep = "\t",header = T)
a<-read.table(file = "young.txt",sep = "\t",header = T)
(2)设置行名和列名
X<-read.csv('young.txt') #在示例数据里有young.txt 注意这里的变量x是一个数据框
colnames(X) #查看列名
rownames(X) #查看行名,默认值的行名就是行号
colnames(X)[1]<-"Anything"#有的公司返回数据,左上角第一格为空,R会自动补为x,用这个命令来修改
X<-read.csv(file = "young.txt",sep = "",header = T,row.names = 1) #row.names的意思是修改第一列为行名
(3)数据框的导出
write.table(X,file = "young2.txt",sep = ",",quote = F)#分隔符改为逗号,字符串不加双引号(默认格式带由双引号)
(4)变量的保存与重新加载
save.image(file="young.RData")#保存当前所有变量
save(X,file="young2.RData")#保存其中一个变量
load("young2.RData")#再次使用RData时的加载命令
(5)提取元素
X[1,2]#第1行的第2列
X[1,]#第1行
X[,2]#第2列,按行展示
X[2]#也是第2列,按列展示
X[1:2]#第1列到第2列
X[c(1,2)]#第1列和第2列
#X$列名,也可以提取列(不用写括号,并且支持Tab自动补全,不过只能提取一列)
X$X1
作业
save(X,file="test.RData")这句代码如果报错object X not found,是为什么,应该怎么解决?
答:没有对X进行赋值,赋值后即可。
网友评论