美文网首页
R 联合SQLite数据库和Spark分析大数据集

R 联合SQLite数据库和Spark分析大数据集

作者: 木䬕 | 来源:发表于2019-06-21 16:19 被阅读0次

SQLite 数据库使用

1.下载SQLite数据库,并配置环境变量,或者再下载个SQLiteStudio进行编辑管理;
2.打开powershell或者cmd,运行命令行sqlite.exe,进入SQLite;
3.可以利用SQLite语句进行新建数据库和表格,进行数据操作和转换。

R里面安装DBI包,连接SQLite数据库,进行操作

library(DBI)
con <- dbConnect(RSQLite::SQLite(), ":memory:")#新建位于内存中的连接,生成的数据都会储存再内存中,或者:
con <- dbConnect(RSQLite::SQLite(),"./test.db")#新建本地数据库或读取本地数据库

R安装sparkly包,创建spark连接

library(sparklyr)
library(dplyr)#用于数据分析
sc <- spark_connect(master = "local")

大数据集分析步骤

1.利用R生成后者下载数据

dbWriteTable(con_b, "mtcars", mtcars, overwrite = TRUE)#将mtcars数据集写入名叫mtcars的表格中,并存入sqlite数据库db文件中,一般一个db文件最多可以存储1TB数据

2.利用SQLite命令语句将表格数据存为csv文件

sqlite.exe test.db --打开本地数据库文件或者已经存储了数据的数据库文件
.tables ---查看test.db数据库文件里有哪些表格
.header on --显示表头
.mode.csv --设置输出文件格式
.output test.csv --输出文件名
.select * from test --选择输出的内容
.quit --退出sqlite
注:--后面是注释内容

3.利用spark_read_csv()读取csv大文件,注意文件必须as.data.frame()后才能读取

总结:这样利用spark连接将几十G甚至几百G的文件分割成几个部分,再利用R连接后处理,其中sqlite作为中介转存数据,可以处理超过R自身内存的大数据集。

相关文章

  • R 联合SQLite数据库和Spark分析大数据集

    SQLite 数据库使用 1.下载SQLite数据库,并配置环境变量,或者再下载个SQLiteStudio进行编辑...

  • Android 数据库

    sqlite详解 sqlite升级,增加字段的语句 数据库框架对比和源码分析 数据库的优化 数据库数据迁移问题

  • dataset与数据库

    近日有需要写点C#程序,有用到Dataset数据集和SQLite数据库 一、SQLite操作,直接贴代码,很简单:...

  • android笔记6

    本章学习目标: 了解SQLite数据库的特点和体系结构 掌握SQLite数据库的建立和操作方法 SQlite介绍 ...

  • 【2020-06-17】如何在python中查看sqlite3中

    问题:如何在python中查看sqlite3中某数据库中的tables?问题分析及解决办法:sqlite3数据库里...

  • spark连接mysql出现java.math.BigInteg

    在Spark连接mysql数据库进行查询数据时遇到这样一个坑 val df:DataFrame = spark.r...

  • iOS中数据库使用什么技术实现的

    使用Sqlite和CoreData实现的 常用数据库: 移动开发常用: Sqlite数据库: CoreData是i...

  • 63. 使用SQLite

    SQLite是一种嵌入式数据库,它的数据库就是一个文件。由于SQLite本身是C写的,而且体积很小,所以,经常被集...

  • App 安全方案

    一、本地数据库加密 目前安全风险:App本地使用了Sqlite进行了本地的数据缓存,和统计分析本地数据库缓存,其中...

  • 第四篇:sqlite数据库与FMDB

    目录一、sqlite数据库二、FMDB 一、sqlite数据库 sqlite数据库是基于C实现的、移动端开发常用的...

网友评论

      本文标题:R 联合SQLite数据库和Spark分析大数据集

      本文链接:https://www.haomeiwen.com/subject/hzayqctx.html