R数据的输入

作者: e3617f9991e1 | 来源:发表于2019-04-15 22:31 被阅读10次

    1.使用键盘输入数据(感觉不怎么常用,一般数据集很小还可以)
    R中的函数edit()会自动调用一个允许手动输入数据的文本编辑器。步骤如下:
    1)创建一个空数据框(或矩阵),其中变量名和变量模式需要与理想中的最终数据集保持一致。
    2)针对这个数据集调用文本编辑器,输入你的数据,并将你的数据保存回此数据对象中。
    2.从带分隔符的文本文件导入数据。(常用)

    mydataframe <- read.table(file,options)
    file 指的是以tab为分隔符的文本文件,options指的是控制如何处理数据的选项:
    header 一个文本文件是否在第一行包含了变量名 header = TRUE header = FALSE
    sep 表示数据的分隔符,默认是sep="",表示一个或者多个空格、制表符、换行、回车,sep = "," 表示用逗号分隔数据,sep="\t",用制表符分隔数据。
    row.names 用于指定一个或多个行标记符的参数
    col.names 如果数据集的第一行不包括变量名,可以使用一个col.names去指定一个包含变量名的字符变量。如果header = FALSE并且col.names选项被省略了,变量会被分别命名为V1,V2以此类推。
    na.strings 可选地用于表示缺失值的字符变量。
    colClasses 可选地分配到某一列的类向量。
    quote 用于对有特殊字符的字符串划定界限的自负床,默认值是双引号或单引号
    skip 读取数据前跳过的行的数目,这个选项在跳过头注释时有用。
    stringsAsfactors 一个逻辑变量,标记处字符向量是否需要转化为因子,默认值是True.
    text 一个指定文字进行处理的字符串。

    3.导入xlsx的数据
    读取excel文件的最好方式就是在Excel中将其导出为一个逗号分隔文件(csv),可以使用read.csv()或者read.table(file,sep = ",")将数据集导入到R中。
    另外的方式就是xlsx包直接导入Excel工作表。
    4.读入其他格式的数据(SAS,XML,HDF5......)不怎么常用(我目前感觉)

    介绍一些处理数据对象的实用函数
    length(object) 显示对象中元素的数量
    dim(object) 显示对象的维度
    str(obiect) 显示某个对象的结构
    class(object) 显示某个对象的类或者类型
    mode(object) 显示某个对象的模式
    c(object1,object2,...) 将对象合并入一个向量
    cbind(object1,object2,...) 按列合并对象
    rbind(object1,object2,...) 按行合并对象
    head(object) 列出某个对象的开始部分
    tail(object) 列出某个对象的最后部分
    rm(object,object,...) 删除一个或者更多个对象

    相关文章

      网友评论

        本文标题:R数据的输入

        本文链接:https://www.haomeiwen.com/subject/uxwpwqtx.html