使用seeds.rb导入大量数据到数据库

作者: pujiaxun | 来源:发表于2016-06-02 02:04 被阅读440次

    最近有个Rails项目,需要把大量的单词导入到数据库里,看我的艰辛历程...

    第一个想法

    我第一想法是编写seeds.rb,自然而然想到使用下面的方式

    # 清空单词数据表
    Vocabulary.delete_all
    # 读取单词,文件中每行一个单词,所以得到是所有单词组成的一个数组
    words = IO.readlines("./config/ext/wordlist.txt")
    words.each do |w|
      # 新建一个Vocabulary对象
      v = Vocabulary.new
      # 将word字段赋值,因为单词后含有换行符,所以使用chomp
      v.word = w.chomp
      # 将length字段赋值
      v.length = w.chomp.length
      # 保存
      v.save
    end
    

    我现在看到这样的代码都想笑,没办法,我第一反应就这样。每个单词新建一个对象,赋值,储存。
    单词数量也没很多,3000个。嗯,我等了一分钟都没跑完,就提前终止掉了,这哪能忍...

    改进(逃...

    我查了一下Rails的文档,发现了create方法,好像要效率高点。

    words.each do |w|
      # 直接创建一个Vocabulary数据
      Vocabulary.create(word: w.chomp, length: w.chomp.length)
    end
    

    没错我还是想死,这次我等了大概一两分钟,跑完了。问了一下队友

    导入三千个单词要2分钟你能忍吗?
    不能。

    好的,我也不能...

    原生SQL语句大法

    于是我Google了一下rails insert mass rows 查到了这篇文章,作者用四种方式插入一万条数据。前面介绍的和我一开始想的差不多,效率很低。
    然后作者给出了原生SQL方式,并用Benchmark测试出效率是其他方法数十倍。
    按照刚才的例子,代码如下:

    # 形成SQL语句需要的规范形式
    # 像这样 ('F**K', '2016-04-27 20:00:00', '2016-04-28 20:00:00', 4)
    words.map!{|w| ("('#{w.chomp}', '2016-04-27 20:00:00', '2016-04-28 20:00:00' , #{w.chomp.length} )") }
    # 构造SQL语句用于执行
    sql = "INSERT INTO vocabularies (word, created_at, updated_at, length) VALUES #{words.join(", ")}"
    # 执行SQL语句
    ActiveRecord::Base.connection.execute sql
    

    原理是用了SQL中这样的语法:

    INSERT INTO MyTable ( Column1, Column2 ) VALUES ( Value1, Value2 ), ( Value1, Value2 ), ( Value1, Value2 )

    整个过程不到一秒,不说了我去学SQL了。。。

    如有疏漏,欢迎评论指出,或者前往Github提出issue~谢谢

    相关文章

      网友评论

        本文标题:使用seeds.rb导入大量数据到数据库

        本文链接:https://www.haomeiwen.com/subject/zuzhdttx.html