美文网首页
全文检索Lucene

全文检索Lucene

作者: 磨陀货_ | 来源:发表于2019-10-17 16:16 被阅读0次

首先我们要认识一下现在生活中主要的搜索有四种

  • 1.windows中搜索

  • 2.Eclipse中搜索

  • 3.在数据库中搜索

  • 4.搜索引擎

各式各样的搜索 每一种搜索方式所用到的技术也是不一样的


什么是全文检索

    官网一点的说法就是从全文数据中进行检索就叫做全文检索(全名搜索)。是基于文本的搜索
    通俗一点的话就是百度搜索,百度就是用的全文检索


全文数据搜索方式

1.顺序扫描法 相对慢 添加索引之后会快一点
2.全文检索 相对就很快
    从非结构化数据中提取出的然后重新组织的信息,就称之为“索引”。即为文本数据建立类似“字典目录”,从而提高检索速度

  • 索引:对于文本的搜索,可以把非结构化进行重组,转换成有结构的数据,这个过程叫做索引。

全文检索的核心

创建索引
搜索索引


全文搜索的特点

 1.快的很
 2.相关度最高的排在最前面
 3.对摘要进行截取
 4.关键字高亮显示
 5.只关注文本,不考虑语义


全文检索的使用场景

 1.可替换数据库模糊查询,提高查询速度
 2.全文索引是搜索引擎的基础
 3.只对“指定领域”的网站进行索引与搜索(即垂直搜索
 4.在word、pdf等各种各样的数据格式中检索内容 比如:ctrl+F
 5.其他场合:比如搜狗拼音输入法 、QQ输入法等

  • 垂直搜索 就是指 专注一个领域的搜索 比如:在百度搜索招聘 就会搜索到这个领域了所有

全文检索应用架构

①采集数据    ②用户查询    ③创建索引返回客户

Lucene

   Apache Lucene 是一个用Java写的高性能、可伸缩的全文检索引擎工具包。它可以方便的嵌入到各种应用中实现针对应用的全文索引/检索功能。Lucene的目标是为各种中小型应用程序加入全文检索功能。ElatisSearch(处理分布式)
  Lucene的核心作者:Doug Cutting是一位资深全文索引/检索专家

相关文章

  • Lucene入门

    什么是Lucene 可以使用Lucene实现全文检索。Lucene是apache下的一个开放源代码的全文检索引擎工...

  • Lucene & 全文检索

    目录结构:1.全文检索 2.Lucene入门3.Lucene进阶 全文检索 一, 生活中的搜索:1.Win...

  • Lucene—全文检索

    1. 案例分析:什么时全文检索,如何实现全文检索   1.1 案例   实现一个文件的搜索功能,通过关键字搜索文件...

  • Lucene 全文检索

    Lucene 全文检索 Field域 Field是文档中的域,包括Field名和Field值两部分,一个文档可以...

  • 全文检索Lucene

    首先我们要认识一下现在生活中主要的搜索有四种 1.windows中搜索 2.Eclipse中搜索 3.在数据库中搜...

  • Elasticsearch

    Elasticsearch 一.全文检索和Lucene Lucene基于java环境,基于Lucene之上包装一层...

  • Lucene简介

    1.Lucene简介 Lucene是apache下的一个开源的全文检索引擎工具包。 1.1.全文检索(Full-t...

  • Lucene

    一、Lucene概述 1、Lucene简介Lucene是apache下的一个开源的全文检索引擎工具包。 2、 全文...

  • lucene的增删改查

    lucene全文检索,还是直接看代码吧 lucene依赖 IndexReader与IndeaSearch工厂类新版...

  • ElasticSearch

    使用elasticsearch 启动 Elasticsearch: Apache Lucene 全文检索(Full...

网友评论

      本文标题:全文检索Lucene

      本文链接:https://www.haomeiwen.com/subject/widkgqtx.html