美文网首页我爱编程
Apache lucene 介绍

Apache lucene 介绍

作者: SteveGuRen | 来源:发表于2017-01-06 11:41 被阅读179次

Apache lucene 介绍

apacche lucene 是开源、高性能、支持全文搜索、跨平台的java API库;理论上它可以用于任何需要实现全文搜索功能的应用。

Apache lucene 特性

可扩展、高性能索引

  • 在现代硬件,索引效率可达150GB/h
  • 内存占用低,只需要使用1MB的堆空间
  • 增量索引速度接近批量索引
  • 索引大小大约是索引文本大小的20~30%

强大、精确、高效的搜索算法

  • 支持权重查询,首先将最优结果返回
  • 支持多种查询类型,句子查询、通配符查询、临近查询、范围查询等等
  • 支持字段搜索,例如文章的标题、作者、内容等等
  • 支持任一字段排序
  • 对合并结果支持多索引查询
  • 可同时进行更新和查询
  • 支持分面搜索,可对结果进行分组,连接
  • 快速,高效内存调用,容错支持
  • 插件化权重模块,包括Vector SpaceModelOkapi BM25
  • 可配置的存储引擎

跨平台解决方案

相关文章

网友评论

    本文标题:Apache lucene 介绍

    本文链接:https://www.haomeiwen.com/subject/tivtbttx.html