一、入门级函数
c, nchar, data, str, dim, names, row.names, head, tail, $, mean
create变量:dataName <- c("","")
字符数量:nchar()
导入数据:data(dataName)
print数据:dataName
数据结构:str(dataName)
数据维度:dim(dataName)
列名称:names(dataName)
行名称:row.names(dataName)
查看头6行:head(dataName)
查看尾6行:tail(dataName)
选择列:dataName$colName
查看均值:mean(dataName$colName)
二、载入数据
read.csv()
dataName <- read.csv('filepath or url')
与pandas类似,需要随时检查验证数据。用str、dim、head、tail、sample。
再高级点的用summary、table。summary类似pd的describe,table有些类似value_counts。
三、数据子集化
常用:subset()
dataSubset() <- subset(data, yourcondition)
补充使用:[ ]
dataSubset() <- dataName[ROWs_conditon, COLs_condition] //行或列的选择条件为空时,表明选择所有数据
四、保存数据
write.table()
write.table(income_total, "data/income-totals.csv", row.names=FALSE, sep=",")
注意:别忘了设置参数sep,同时row.names推荐设置为FALSE(默认为TRUE)。
R技能高级水平资料:
使用R进行数据转化实例
R高级入门指南 ]
参考:
Loading Data and Basic Formatting in R | FlowingData
Quick-R: Subsetting Data
网友评论