美文网首页
Lucene的使用介绍

Lucene的使用介绍

作者: AndrewMyh | 来源:发表于2018-10-01 01:14 被阅读0次

今天介绍第二个任务——由得到的XML获得索引,将使用到Lucene包。

本文作者:龙鹏

本文前提:已经获得XML文件。

看完本文你将知道:如何建立索引,如何使用索引。

以下是核心代码的截图和说明:

1、解析

首先确立索引所存放的位置     确定分类器和写索引对象       对存取xml文件的to文件夹中每一个xml文件即每一个file对象进行遍历操作 对要获取的一系列内容进行初始化       通过reader对象的read方法读取xml文件,获取document对象,getRootElement方法可以获取document的根节点       即这里的TEI节点       Dom4j有一系列对此document对象进行解析的方法,可以自己去探索 如果懒得看函数,最简单的方法可以一直用element方法,这个可以获取任意一个节点的子节点,可以通过这个方法一步一步获取下面的节点元素 如上述element对象title1author就是analytic节点,title存在analytic节点下的title节点中elementTextTrim可以获取某节点下的某个子节点的内容,即上述代码中title1author.elementTextTrim("title");就是我们要的title,

用这个方法可以获取我们想要的xml中的所有内容(对其解析方法有很多,此处只介绍最容易懂的方法),可以仿照获取author,date,affiliation,address,fulltext,page等

1、写入索引

新建document对象       以title为例介绍如何存储: 第一个参数:域的名称 ,第二个参数:域的内容 ,第三个参数:是否存储 对所有已经获取的内容进行相似的操作       将这些加入document对象中       将document对象加到索引中,即此xml所有内容已经被写入索引 关闭此indexWriter对象      

建立的索引如下图:

索引

3、使用索引

下面介绍如何对索引进行查找:自己看注释吧

4的fulltext可以按照自己想查的域进行修改, keyword就是搜索的关键词

5的20是搜索的条数,如果不够只会返回最大的条数 用get方法获取自己之前写入的域的内容

调用输出 结果

回微信公众号给个打赏呗<( ̄︶ ̄)↗[GO!]

相关文章

  • Lucene的使用介绍

    今天介绍第二个任务——由得到的XML获得索引,将使用到Lucene包。 本文作者:龙鹏本文前提:已经获得XML文件...

  • lucene索引文件格式-概览

    Apache Lucene - 索引文件格式 介绍 本文档定义了此版本(4.10.4)Lucene中使用的索引文件...

  • 4.1、苏宁百万级商品爬取 代码讲解 索引建立

    接下去我们进行索引建立,本项目索引建立我们使用Lucene.Net。在使用前我们介绍以下Lucene是什么! Lu...

  • Lucene 7.4 初体验

    前言 本文的简要内容: Lucene简介 体验Lucene Demo Lucene 核心类介绍 Lucene 索引...

  • Lucene介绍

    1、https://zhuanlan.zhihu.com/p/357950702、lucene Collector...

  • Lucene的介绍

    本文我将为大家讲解全文检索技术——Lucene,现在这个技术用到的比较多,我觉得大家还是应该掌握一下,不说多精通,...

  • lucene排序、检索、模糊查询以及多条件查询

    最近研究Lucene,找排序功能没有找到,所以撸了一下源码,下面开始介绍Lucene排序使用 一、全文搜索,多条件...

  • Lucene系列文章

    注:所有内容及代码基于Lucene 8.2.0版本。 Lucene系列(1)——理论介绍 Lucene系列(2)—...

  • Elasticsearch底层使用的使用的lucene,luce

    Elasticsearch底层使用的使用的lucene lucene使用的是倒排索引的方式来进行加快检索速度 倒排...

  • Elasticsearch内存

    核心概念 基于Lucene Java应用 内存使用分析 Lucene的内存消耗 倒排索引。(堆内存)Lucene中...

网友评论

      本文标题:Lucene的使用介绍

      本文链接:https://www.haomeiwen.com/subject/fybgoftx.html