1.使用键盘输入数据(感觉不怎么常用,一般数据集很小还可以)
R中的函数edit()会自动调用一个允许手动输入数据的文本编辑器。步骤如下:
1)创建一个空数据框(或矩阵),其中变量名和变量模式需要与理想中的最终数据集保持一致。
2)针对这个数据集调用文本编辑器,输入你的数据,并将你的数据保存回此数据对象中。
2.从带分隔符的文本文件导入数据。(常用)
mydataframe <- read.table(file,options)
file 指的是以tab为分隔符的文本文件,options指的是控制如何处理数据的选项:
header 一个文本文件是否在第一行包含了变量名 header = TRUE header = FALSE
sep 表示数据的分隔符,默认是sep="",表示一个或者多个空格、制表符、换行、回车,sep = "," 表示用逗号分隔数据,sep="\t",用制表符分隔数据。
row.names 用于指定一个或多个行标记符的参数
col.names 如果数据集的第一行不包括变量名,可以使用一个col.names去指定一个包含变量名的字符变量。如果header = FALSE并且col.names选项被省略了,变量会被分别命名为V1,V2以此类推。
na.strings 可选地用于表示缺失值的字符变量。
colClasses 可选地分配到某一列的类向量。
quote 用于对有特殊字符的字符串划定界限的自负床,默认值是双引号或单引号
skip 读取数据前跳过的行的数目,这个选项在跳过头注释时有用。
stringsAsfactors 一个逻辑变量,标记处字符向量是否需要转化为因子,默认值是True.
text 一个指定文字进行处理的字符串。
3.导入xlsx的数据
读取excel文件的最好方式就是在Excel中将其导出为一个逗号分隔文件(csv),可以使用read.csv()或者read.table(file,sep = ",")将数据集导入到R中。
另外的方式就是xlsx包直接导入Excel工作表。
4.读入其他格式的数据(SAS,XML,HDF5......)不怎么常用(我目前感觉)
介绍一些处理数据对象的实用函数
length(object) 显示对象中元素的数量
dim(object) 显示对象的维度
str(obiect) 显示某个对象的结构
class(object) 显示某个对象的类或者类型
mode(object) 显示某个对象的模式
c(object1,object2,...) 将对象合并入一个向量
cbind(object1,object2,...) 按列合并对象
rbind(object1,object2,...) 按行合并对象
head(object) 列出某个对象的开始部分
tail(object) 列出某个对象的最后部分
rm(object,object,...) 删除一个或者更多个对象
网友评论