R语言学习笔记(2)导入数据

作者: 山阴少年 | 来源:发表于2017-12-08 14:05 被阅读8次

导入CSV文件

  文件:G:/autompg.csv,表格中的全部字段为:

  • mpg:continuous
  • cylinders:multi-valued discrete
  • displacement:continuous
  • horsepower
  • weight:continuous
  • acceleration:continuous
  • model year:multi-valued discrete
  • origin:multi-valued discrete
  • car name:string (unique for each instance)

  读取文件:

if(FALSE){stringsAsFactors=FALSE读取字符串变量}
auto_mpg <- read.table("G:/autompg.csv", header=TRUE, sep=',',stringsAsFactors=FALSE,quote = "")
summary(auto_mpg)

  输出为:(与实际表格的字段类型不符)
[图片上传失败...(image-2e96a7-1512713264789)]

  可以用colClasses为每一列指定一个类,例如logical(逻辑型)、numeric(数值型)、character(字符型)、factor(因子)。

auto_mpg <- read.table("G:/autompg.csv",colClasses=c("numeric","factor","numeric","numeric","numeric","numeric","factor","factor","character") ,header=TRUE, sep=',',quote = "")
summary(auto_mpg)
if(FALSE){查看前5行}
auto_mpg[1:5,]

  输出结果为:
[图片上传失败...(image-1143c2-1512713264789)]

导入EXCEL文件

  1. 将EXCEL文件转化为CSV文件,再导入CSV文件(最佳方式)

  2. 利用xlsx包或者RODBC包导入数据

if(FALSE){安装xlsxC包}
install.packages("xlsx")
if(FALSE){读取autompg.xlsx的第一页表}
library(xlsx)
mydata <- read.xlsx("G:/autompg.xlsx", 1)

  这将又会出现导入CSV文件的问题,即导入的数据类型与原来数据类型不一致。

导入数据库表格

  在R中通过RODBC包访问一个数据库也许是最流行的方式,这种方式允许R连接到任意一种拥有ODBC驱动的数据库,其实几乎就是市面上的所有数据库。
  以导入MySQL数据库数据表为例。前提是你的电脑上已经安装了MySQL的ODBC驱动程序,网址为https://dev.mysql.com/downloads/connector/odbc/.
[图片上传失败...(image-233540-1512713264789)]
安装完MySQL的ODBC驱动后,打开控制面板的管理工具,根据自己的Windows系统版本打开ODBC数据源。再连接到MySQL数据库,我们以访问test数据库为例,数据源名称为connect_mysql.

ODBC驱动填写
这样设置完后,我们就可以利用R语言连接数据库了(注意:这是双向的连接)。
library(RODBC)
if(FLASE){连接数据库,账号为root,密码为123456}
myconn <-odbcConnect("connect_mysql",uid="root",pwd="123456")
if(FALSE){连接该数据库的product表格}
mysqldata <- sqlFetch(myconn, "product")

对数据库的操作

library(RODBC)
if(FALSE){连接数据库+账号为root+密码为123456}
myconn <-odbcConnect("connect_mysql",uid="root",pwd="123456")
if(FALSE){连接该数据库的product表格+并查看前5行}
mysqldata <- sqlFetch(myconn, "product")
print(mysqldata[1:5,])
if(FALSE){对product表进行SQL查询}
print(sqlQuery(myconn, "select * from product where maker ='E'"))
print(sqlQuery(myconn, "select maker,max(model) as max_model from product group by maker"))
if(FALSE){关闭连接}
close(myconn)
数据库操作

相关文章

  • 第2章 创建数据集

    《R语言实战》笔记系列 本章学习大纲 1.R的数据结构 2.输入数据 3.导入数据 4.标注数据 第一部分 R的数...

  • R语言学习笔记(2)导入数据

    导入CSV文件   文件:G:/autompg.csv,表格中的全部字段为: mpg:continuous cyl...

  • 64-R自动编码器模型识别异常数据

    《深度学习精要(基于R语言)》学习笔记 1、数据导入与h2o初始化 2、训练自动编码器模型 一共561个变量,使用...

  • 学习小组Day5笔记--kan

    笔记来自生信星球学习小组资料 Day5 学习内容-R语言数据类型 1.思维导图镇楼 2.R语言数据类型 向量 ve...

  • R 一些包速查

    1. R 语言参考表 2. R 数据导入 3. dplyr 数据转换 4. ggplot2 5. caret 包 ...

  • R-数据处理基础篇-一篇概括总结R语言变量储存结构

    目录 0.问题导入 1.示例数据及样本程序 2.R语言数据变量存储方式二之矩阵(matrix) 3.R语言数据变量...

  • 学习小组Day4笔记--行

    正式开始学习R语言了,今天笔记内容为R语言基础和ggplot2的入门学习 R语言基础 1、认识R与RStudio ...

  • day5 阿来

    继续学习R语言 R语言数据学习 数据R语言学习.png 数据输入 数据输出 总结 R语言学习的第二天,熟悉了很多操...

  • R语言-0基础学习4-实战1-常见操作

    R语言学习系列R语言-0基础学习1-数据结构R语言-0基础学习2-构建子集R语言-0基础学习3-循环排序信息处理函...

  • 学习小组Day4笔记--呛

    Day4学习笔记 R语言初体验 怎么理解R 百度百科:R语言常用在数据统计分析、数据绘图和数据挖掘,是一种编程语言...

网友评论

    本文标题:R语言学习笔记(2)导入数据

    本文链接:https://www.haomeiwen.com/subject/wnseixtx.html