1. 数据载入
1) 矩阵型数据载入
read.table()主要读取以空格分割的行
read.table(file, header=FALSE, sep="", quote="\"'",dec = ".",
numerals = c("allow.loss", "warn.loss", "no.loss"),
row.names, col.names, as.is = !stringsAsFactors,
na.strings = "NA", colClasses = NA,
nrows = -1,skip = 0, check.names = TRU...)
read.delim()读取其他分割的行
read.table(file, header = FALSE, sep = "", quote = "\"'", dec = ".",
row.names, col.names, as.is = !stringsAsFactors,
na.strings = "NA"...)
常用参数:
file 就是要读取的文件
header=TURE 表示第一行为变化变量名
sep="" 表示文中的分割符为空格,可以用其他代替
dec="." 表示小数点的字符,
row.names, col.names 用来表示项链的行名和列名
na.strings="NA" 用来表示缺失值
skip=0 表示跳过前几行
读入数据后,可以用几种方式来查看数据
mode() 查看数据属性
names() 查看变量名
head() 查看前几行
dim() 查看维度,即几行几列
2) excel数据载入
对于小量数据,我们可以直接通过键盘复制
a=read.delim("clipboard")
如果数据量大,利用RODBC软件包进行读取
3) 网页数据载入
readHTMLTable()
首先要安装并读取XML包
library(XML)
readHTMLTable(doc, header = NA,
colClasses = NULL, skip.rows = integer(), trim = TRUE,
elFun = xmlValue, as.data.frame = TRUE, which = integer(),
...)
doc给出的是HTML文件或者网页地址
which是返回网页中的那几个表格,注意如果网址较长没在输入时需要换行,使用函数gsub将字符中的换行符删去。
baseURL = gsub("\\n", "", baseURL)
网友评论