美文网首页
Solr文件索引'example->files'文档

Solr文件索引'example->files'文档

作者: 巧阿 | 来源:发表于2018-10-12 17:07 被阅读0次

Solr-Powered文件搜索

本文将指导您为自己的文件集创建一个solr驱动的搜索引擎,包括Word文档,PDF,HTML和其他许多支持的类型。

有关进一步说明,请参阅指南末尾的常见问题解答。

开始吧

要启动Solr,请输入以下命令(确保您已进入Solr的安装目录):

bin/solr start

如果您已正确启动,您应该看到以下输出

Waiting to see Solr listening on port 8983

Started Solr server on port 8983 (pid=<your pid>). Happy searching!


创建Core/Collection

在你能索引你的文件前,您需要创建一个Core/Collection。通过输入以下内容来执行此操作:

bin/solr create -c files -d example/files/conf

现在,您已使用默认配置文件创建了一个名为"files"的Core

你应该看到以下响应信息:

Creating new core 'files' using command:http://localhost:8983/solr/admin/cores?action=CREATE&name=files&instanceDir=files
{

"responseHeader":{

"status":0,

"QTime":239},

"core":"files"}


开始索引文件

回到命令行,输入以下命令,将需要索引的文件发布到Core:

bin/post -c files ~/Documents

这里需要花费一些时间,速度取决于文件的多少.接下来就是见证奇迹的时刻.当所有文件都被编入索引后,你会看到类似下面的东西:

<some number> files indexed.
COMMITting Solr index changes to http://localhost:8983/solr/files/update...
Time spent: <some amount of time>

要查看已接受的文件类型列表,请执行以下操作:

bin/post -h

浏览文档

您的文档信息可以以多种格式查看:XML,JSON,CSV,当然还有漂亮的HTML界面。

要查看HTML界面查看文档信息,在地址栏中输入网址:

http://localhost:8983/solr/files/browse

要以XML或其他格式查看文档,请将&wt添加到该URL的末尾。如:

http://localhost:8983/solr/files/browse?&wt=xml


ADMIN UI

验证Core是否已创建的另一种方法是在管理员界面中查看。

  • Admin_UI是索引和查询Solr索引的可视化工具。

要访问管理界面,请在浏览器中访问:

http://localhost:8983/solr/

  • 只有在Solr运行时才能访问Admin UI

点击页面左侧的"Core Selector"。你能在列表中看到上面创建的files Core,点击可以进行操作。如果列表中没有files,那么你的Core可能没有被创建,你需要重新输入创建命令。

另外,你可以直接访问:http://localhost:8983/solr/#/files进入Core操作页面。

现在您已经打开了Core操作页面了。这里有很多不同的工具供你用来分析\查询你的Core;你可以在完成文档索引后使用这些功能。

记下核心统计信息中的"Num Docs"字段。如果在完成文档索引后,它显示Num Docs为0,则表示索引有问题


QUERYING INDEX

在管理界面中,在查询框中输入一个单词,以查看哪些文档包含该单词。

您可以通过选择不同的内容类型的选项卡来筛选结果。将鼠标悬停在页面的右上角的地球图标上可以查看该接口的国际版。

注意右侧的标签,他们是程序在索引过程中通过分词提取出来的词语。

单击词语可以查看包含它们的文档。

*查询索引的另一种方法是在浏览器地址栏中的通过URL查询。如: http://localhost:8983/solr/files/browse?q=Lucene


常见问题

为什么在创建Core时要使用-d

-d 用来指定配置文件路径,不加则使用默认配置文件;在示例中使用了配置索引和查询富文本文件的配置。

如何删除Core?

要删除核心(该文件),可以在命令shell中输入以下内容:

bin/solr delete -c files

你应该看到如下信息:

Deleting core 'files' using command:

http://localhost:8983/solr/admin/cores?action=UNLOAD&core=files&deleteIndex=true&deleteDataDir=true&deleteInstanceDir=true

{"responseHeader":{

"status":0,

"QTime":19}}

调用Solr Core管理程序“UNLOAD”参数“deleteDataDir”和“deleteInstanceDir”,以确保同时删除与Core关联的所有数据.

如何更改/浏览用户界面?

主要模板位于example/files/conf/velocity下。为了编辑这些文件(无需使用更新的配置重新创建或修补Core/Collection,Solr可以使用特殊配置启动

设置conf/velocity目录的absolute路径,如下所示:

bin/solr start -Dvelocity.template.base.dir=</full/path/to>/example/files/conf/velocity/

如果要调整现有集合的浏览模板,请编辑核心配置

server/solr/files/conf/velocity下.

相关文章

网友评论

      本文标题:Solr文件索引'example->files'文档

      本文链接:https://www.haomeiwen.com/subject/udmgaftx.html