使用seeds.rb导入大量数据到数据库

作者: pujiaxun | 来源:发表于2016-06-02 02:04 被阅读440次

最近有个Rails项目,需要把大量的单词导入到数据库里,看我的艰辛历程...

第一个想法

我第一想法是编写seeds.rb,自然而然想到使用下面的方式

# 清空单词数据表
Vocabulary.delete_all
# 读取单词,文件中每行一个单词,所以得到是所有单词组成的一个数组
words = IO.readlines("./config/ext/wordlist.txt")
words.each do |w|
  # 新建一个Vocabulary对象
  v = Vocabulary.new
  # 将word字段赋值,因为单词后含有换行符,所以使用chomp
  v.word = w.chomp
  # 将length字段赋值
  v.length = w.chomp.length
  # 保存
  v.save
end

我现在看到这样的代码都想笑,没办法,我第一反应就这样。每个单词新建一个对象,赋值,储存。
单词数量也没很多,3000个。嗯,我等了一分钟都没跑完,就提前终止掉了,这哪能忍...

改进(逃...

我查了一下Rails的文档,发现了create方法,好像要效率高点。

words.each do |w|
  # 直接创建一个Vocabulary数据
  Vocabulary.create(word: w.chomp, length: w.chomp.length)
end

没错我还是想死,这次我等了大概一两分钟,跑完了。问了一下队友

导入三千个单词要2分钟你能忍吗?
不能。

好的,我也不能...

原生SQL语句大法

于是我Google了一下rails insert mass rows 查到了这篇文章,作者用四种方式插入一万条数据。前面介绍的和我一开始想的差不多,效率很低。
然后作者给出了原生SQL方式,并用Benchmark测试出效率是其他方法数十倍。
按照刚才的例子,代码如下:

# 形成SQL语句需要的规范形式
# 像这样 ('F**K', '2016-04-27 20:00:00', '2016-04-28 20:00:00', 4)
words.map!{|w| ("('#{w.chomp}', '2016-04-27 20:00:00', '2016-04-28 20:00:00' , #{w.chomp.length} )") }
# 构造SQL语句用于执行
sql = "INSERT INTO vocabularies (word, created_at, updated_at, length) VALUES #{words.join(", ")}"
# 执行SQL语句
ActiveRecord::Base.connection.execute sql

原理是用了SQL中这样的语法:

INSERT INTO MyTable ( Column1, Column2 ) VALUES ( Value1, Value2 ), ( Value1, Value2 ), ( Value1, Value2 )

整个过程不到一秒,不说了我去学SQL了。。。

如有疏漏,欢迎评论指出,或者前往Github提出issue~谢谢

相关文章

  • 使用seeds.rb导入大量数据到数据库

    最近有个Rails项目,需要把大量的单词导入到数据库里,看我的艰辛历程... 第一个想法 我第一想法是编写seed...

  • 【Spring Boot】简单实践

    lombok 使用Spring Boot整合SSM工程;需要使用到数据库数据。 将数据库表数据导入到数据库中(sp...

  • Sqoop数据的导入导出

    数据导入1、导入数据库表数据到hdfsmysql创建表,插入数据,为了使用方便复制了如下 使用下面的命令将test...

  • MySQL后台执行SQL导入

    一、背景介绍 需要向MySQL数据库中导入大量SQL,而且多个SQL文件到不小,最大的有5.47GB。无论使用Na...

  • Centos7 导入mysql脚本

    导入(1)登录数据库: (2)使用数据库 (3)导入数据 /workspace/db-data/tablename...

  • MySQL数据库的读取

    数据库文件导入到Python 使用Python读取数据库文件可以使用sqlalchemy库的create_engi...

  • ESRI Personal GeoDatabase(MDB)导入

    将 esri 的数据库( .mdb 格式)导入到开源数据库 postgreSQL 中 使用fwtools工具导出到...

  • mongodb数据库的备份和导入

    //将数据库备份到路径(备份到这个路径) //将数据库导入到Mongodb(将这个文件导入到数据库) 作者:南风一...

  • Oracle数据库导入csv文件(sqlldr命令行)

    1.说明 Oracle数据库导入csv文件,当csv文件较小时,可以使用数据库管理工具,比如DBevaer导入到数...

  • 配置数据库

    docker启动数据库 使用navicat添加数据库并设置用户名密码 注:需要导入一条数据到数据库,数据库才能被编辑

网友评论

    本文标题:使用seeds.rb导入大量数据到数据库

    本文链接:https://www.haomeiwen.com/subject/zuzhdttx.html