美文网首页
全文搜索引擎

全文搜索引擎

作者: 北海北_6dc3 | 来源:发表于2020-05-12 18:02 被阅读0次

https://www.cnblogs.com/buqingyuan/p/10419225.html
https://my.oschina.net/u/3080373/blog/2963570

全文搜索引擎

image.png

Lucene【仅仅是一个库】

Lucene是一套用于全文检索搜索开放源码程序库,由Apache软件基金会支持和提供。Lucene提供了一个简单却强大的应用程序接口,能够做全文索引和搜索,在Java开发环境里Lucene是一个成熟的免费开放源代码工具;就其本身而论,Lucene是现在并且是这几年,最受欢迎的免费Java信息检索程序库。

Elasticsearch 与 Solr 的比较总结

  • 二者安装都很简单;
  • Solr 利用 Zookeeper 进行分布式管理,而 Elasticsearch 自身带有分布式协调管理功能;
  • Solr 支持更多格式的数据,而 Elasticsearch 仅支持json文件格式;
  • Solr 官方提供的功能更多,而 Elasticsearch 本身更注重于核心功能,高级功能多有第三方插件提供;
  • Solr 在传统的搜索应用中表现好于 Elasticsearch,但在处理实时搜索应用时效率明显低于 Elasticsearch。
  • Solr 是传统搜索应用的有力解决方案,但 Elasticsearch 更适用于新兴的实时搜索应用。
    性能比较差异

当单纯的对已有数据进行搜索时,Solr更快。

Search Fesh Index While Idle

当实时建立索引时, Solr会产生io阻塞,查询性能较差, Elasticsearch具有明显的优势。

search_fresh_index_while_indexing

随着数据量的增加,Solr的搜索效率会变得更低,而Elasticsearch却没有明显的变化。

search_fresh_index_while_indexing

综上所述,Solr的架构不适合实时搜索的应用。

实际生产环境测试*

下图为将搜索引擎从Solr转到Elasticsearch以后的平均查询速度有了50倍的提升。

average_execution_time
参考文档:
搜索引擎选择: Elasticsearch与Solr搜索引擎选型调研文档

相关文章

  • 【ES从入门到实战】一、全文检索-ElasticSearch-简

    简介 elasticsearch 全文搜索属于最常见的需求,开源的 Elasticsearch 是目前全文搜索引擎...

  • 构建全文搜索引擎

    实现快速全文搜索引擎的方法(2种):(1)利用全扫描进行全文搜索(2)利用索引进行全文搜索 利用全扫描进行全文搜索...

  • Django 引入全文检索

    1.安装模块 全文检索管理模块haystack、全文搜索引擎模块whoosh和中文分词jiebapip insta...

  • ES(Elasticsearch)支持PB级全文搜索引擎入门教程

    全文搜索属于最常见的需求,开源的Elasticsearch(以下简称 Elastic)是目前全文搜索引擎的首选。 ...

  • 全文搜索引擎

    https://www.cnblogs.com/buqingyuan/p/10419225.htmlhttps:/...

  • 网络商务信息检索,采集和应用

    利用搜索引擎搜集网络商务信息 常用的搜索引擎分类 从工作原理上划分,常用的搜索引擎类检索工具有两类: 全文搜索引擎...

  • ES基础-原理篇

    ES - 基础 ES简介篇 ES介绍 ElasticSearch是一种分布式全文搜索引擎,基于Lucene(全文搜...

  • 搜索引擎

    Elasticsearch 分布式搜索引擎 Solr 不是实时的搜索引擎 Lucene 全文检索工具包单独使用Lu...

  • ElasticSearch入门

    ElasticSearch笔记 前言 Elasticsearch 是一个开源的搜索引擎,建立在一个全文搜索引擎库 ...

  • 搜索引擎基本工作原理

    了解搜索引擎的工作原理对我们日常搜索应用和网站提交推广都会有很大帮助。 ■ 全文搜索引擎搜索引擎的自动信息搜集功能...

网友评论

      本文标题:全文搜索引擎

      本文链接:https://www.haomeiwen.com/subject/jrqmnhtx.html