美文网首页react + dva + antd
PostgreSQL 的全文检索系统之 pg_search 实现

PostgreSQL 的全文检索系统之 pg_search 实现

作者: 求知久久编程学院 | 来源:发表于2020-01-16 14:50 被阅读0次

    1. 前言1

    pg_search是一个用于PostgreSQL全文检索的gem,它使用起来简单,功能也很强大。

    以本站为例,文章都是放在articles这张表中,文章有标题和内容,即title和body,现在要对这两个做全文检索。

    2. 安装和使用

    安装gem

    gem 'pg_search'
    

    查看pg_search的readme文档就可以知道。它主要有两种使用方式,分别是Multi-search和search scopes。Multi-search是适合于网站比较复杂,例如多张表,要把多张表揉在一起,放到一张表来做查找。现在我们的网站简单,不需要这个功能,所以我们来看看search scopes的用法。

    class Article < ActiveRecord::Base
      include PgSearch
      pg_search_scope :search_by_title_or_body, :against => [:title, :body]
    end
    

    rails console创建一些文档,之后就能用Article.search_by_title_or_body来搜索了。

    这样再结合表单就能实现一个搜索系统的。

    3. 其他功能

    pg_search还有其他强大的功能。我们来介绍一下。

    3.1 关联(Searching through associations)

    我们现在是在articles这张上做查询,那是因为我们的网站简单,但有时候是要跨表的,那也很简单。比如,article是has_many :tags的,就可以这样。

    class Article < ActiveRecord::Base
      include PgSearch
      pg_search_scope :search_by_title_or_body,
                      :against => [:title, :body],
                      :associated_against => {
                        :tags => [:name],
                      }
    end
    

    可以查看log看具体做了什么操作。其实就是joins之类。

    3.2 字典和中文支持(dictionary)

    这篇文章PostgreSQL的全文检索系统之中文支持(三)有介绍PostgreSQL中文支持。

    安装好那个中文插件,和pg_search结合那太简单了,指定dictionary就好了。

    class Article < ActiveRecord::Base
      include PgSearch
      pg_search_scope :search_by_title_or_body,
                      :against => [:title, :body],
                      :associated_against => {
                        :tags => [:name],
                      },
                      :using => {
                        :tsearch => {:dictionary => "testzhcfg"}
                      }
    end
    
    3.3 权重(Weighting)

    可以给需要搜索的项加上优先级,比如,标题要优先于内容。

    class Article < ActiveRecord::Base
      include PgSearch
      pg_search_scope :search_by_title_or_body,
                      :against => {
                        :title => 'A',
                        :body => 'B'
                      },
                      :associated_against => {
                        :tags => [:name],
                      },
                      :using => {
                        :tsearch => {:dictionary => "testzhcfg"}
                      }
    end
    

    可以看看日志,如果有类似于"setweight"的输出,说明成功了。

    3.4 前缀(prefix)

    假如要搜索一个词,例如rails,但是忘了怎么拼写,只记得前两个单词,那就是ra,但输入ra时也能找到关于rails的文章,这就是前缀的作用。使用也很简单。

    class Article < ActiveRecord::Base
      include PgSearch
      pg_search_scope :search_by_title_or_body,
                      :against => {
                        :title => 'A',
                        :body => 'B'
                      },
                      :associated_against => {
                        :tags => [:name],
                      },
                      :using => {
                        :tsearch => {:dictionary => "testzhcfg", :prefix => true}
                      }
    end
    
    3.5 否定(negation)

    否定就是可以搜索不包含的内容,比如!ruby,就是不搜索ruby,其他的都搜索,一个相反过程啦。

    class Article < ActiveRecord::Base
      include PgSearch
      pg_search_scope :search_by_title_or_body,
                      :against => {
                        :title => 'A',
                        :body => 'B'
                      },
                      :associated_against => {
                        :tags => [:name],
                      },
                      :using => {
                        :tsearch => {:dictionary => "testzhcfg", :prefix => true, :negation => true}
                      }
    

    还有其他各种用法,normalization用于排序,any_word是否匹配任何一个,dmetaphone模糊匹配等。

    完结。

    相关文章

      网友评论

        本文标题:PostgreSQL 的全文检索系统之 pg_search 实现

        本文链接:https://www.haomeiwen.com/subject/uevfzctx.html