创建向量
a<-c(1,2,3,4)
rep(2:5,2) #创建重复向量
a[3]#向量中第三个数据
a[a>3]#向量中满足大于3的要素
a[c(1,2,4)]#向量中第一个第二个和第四个要素
a[2:3] #向量中2到3的数据
a[-1]#去掉第一个值
a[-1:-3]#去掉前三个值
创建矩阵
x<-matrix(1:12,3,4)#默认按照列来进行排
x1<-matrix(1:12,3,4,byrow=T) #按照行来进行排
x2<-diag(3) #生成3阶单位矩阵
矩阵子元素的提取
x[2,2] #取第二行第二列的某个数
x[2,]#取遍第二行的数
x[,2]#取第二列数
x[c(1:2),c(2:3)]#取1到2行,2到3列的数据
x[2,c(1:3)]#取第二行,1到3列的数据
数据框的创建
col1<-c(1:4)
col2<-c('a','b','c','d')
col3<-c('famale','famale','male','male')
mydata<-data.frame(col1,col2,col3) #col1,col2,col3自动成为字段名称
name1<-colnames(mydata) #得到每列的字段名称
mydata[1:2]#取出1列和2列的全部要素
mydata$col1 #$取出col1的全部要素
列表数据list
R数据类型中最为复杂的一种数据结构,可以包含任何对象的组会,通过list()来创建,mylist <- list(object1, object2, …)
g <- "My First List"
h <- c(25, 26, 18, 39)
j <- matrix(1:10, nrow = 5)
k <- c("one", "two", "three")
mylist <- list(title= g, ages = h, j, k)
mylist
因子factor
概念:是一种向量对象,它给自己的组件指定了一个离散的分类(分组),它的组件由其他等长的向量组成。
province <- c("四川", "湖南", "江苏", "四川", "四川", "四川", "湖南", "江苏", "湖南", "江苏")
pf <- factor(province)
数据的存储
保存为txt
write.table(mydata,file="d:/lucc area/mydata.txt",row.names = F,quote=F)
# row.names = F :不写入行名,quote = F :变量名不用双引号。
#保存为csv格式的
write.csv(mydata,file ='d:/lucc area/mydata.csv' )
网友评论