美文网首页
Indri建立索引

Indri建立索引

作者: fliquidy | 来源:发表于2016-10-02 18:03 被阅读0次

使用indri建立index


如果你已经编译过indri的源代码,你应该可以在buildindex目录下找到IndriBuildIndex这个文件。这个文件大约17MB,就是我们用来建立索引的可执行文件。这个文件你可以把它拷到任何地方。为了方便,我把它拷到了一个新文件夹bin

首先,在建索引之前,我们要告诉程序我们要为哪些文件建立索引。对你来说,就是为了database中所有题目建立索引。所以,首先你要新建一个文件夹,文件夹中为每一个题目建立一个txt文件。

下图中,我在docs文件夹中建立了6个txt文件。每个文件中有一段话。


存放文件的目录 文件的内容

接下来,我们要写建立索引所需要的参数。

首先我们要新建一个文件,里面的内容为

<parameters>
<memory>200m</memory>
<index>/mnt/i/databackup/testdocs/</index>
<corpus>
<path>/mnt/i/databackup/docs/</path>
<class>text</class>
</corpus>
</parameters>

注意,因为我使用win10的bash on ubuntu,所以他的路径地址是/mnt/i/databackup/docs/。另外,注意最后有个斜杠,表示这是一个文件夹,此文件夹下的所有文件都要建立索引。

接下来我们到bin路径下(我们刚才把IndriBuidIndex拷到了此目录下)


我们刚才新建的bin目录

执行命令./IndriBuildIndex parameter_file.txt

执行命令后的输出

可以看到索引已经建好了。然后去看一下刚才我设定的index的位置

index已经建立

这样,index就已经建立了。

相关文章

  • Indri建立索引

    使用indri建立index 如果你已经编译过indri的源代码,你应该可以在buildindex目录下找到Ind...

  • 搜索引擎Indri系列:建立索引 (Indexing)

    在为文档集建立索引时,需要执行IndriBuildIndex path-to-to-index_parameter...

  • 搜索引擎Indri系列:安装及使用

    Indri是Lemur项目衍生的一个基于语言模型的新的搜索引擎,由University of Massachuse...

  • 搜索引擎Lucene(4):索引的创建过程

    1、索引维护 创建索引的过程如下: 建立索引器 Indexwriter。 建立文档对象 Document。 建立信...

  • 联合索引-以及如何使用索引

    联合索引 建立索引的时候,尽量建立联合索引,即多个字段组成1个索引。因为如果针对单个字段建立索引的话,会造成索引过...

  • 配置phRank

    编译iState文件夹中的indri_api 在已经编译好的indri文件夹中,可以找到Makefile.app文...

  • 索引创建-oracle

    索引,索引的建立、修改、删除建立索引 CREATE INDEX命令语法: CREATE INDEXCREATE [...

  • MySQL索引建立规则及优化

    概述     相信搭建都知道数据库的常见优化方式,就是建立索引;但是何时建立索引、那些字段需要建立索引,索引是否生...

  • 10 两表优化案例

    创建表 SQL语句 在左表建立索引 在右表建立索引,删掉左表索引 在右表建立索引,type变为ref,rows优化...

  • mongodb索引

    先题几个问题 什么是索引? 如何建立索引? 如何选择建立索引的字段? 如何强制使用索引? 如何评估索引效率? 如果...

网友评论

      本文标题:Indri建立索引

      本文链接:https://www.haomeiwen.com/subject/mxvryttx.html