美文网首页
nutch2.2.1与solr4.5.1的整合

nutch2.2.1与solr4.5.1的整合

作者: trieyouth | 来源:发表于2016-04-05 21:28 被阅读498次

    前言

    这是看到nutch可以跑起来的最后一步,加油!

    solr的下载

    本来我还是想上传CSDN的,但是看了看100多M,还是算了吧。

    运行solr

    解压solr后,进入${SOLR_HOME}/example,运行start.jar

    java -jar start.jar
    

    验证solr是否启动成功

    进入java http://localhost:8983/solr,看到如下页面说明启动成功

    截图

    nutch整合solr

    将${NUTCH_DIR}/conf/schema-solr4.xml拷贝到${SOLR_DIR}/example/solr/collection1/conf/并重命名为schema.xml,在fields域里最后添加一行

    <field name="_version_" type="long" indexed="true" stored="true" multiValued="false"/>
    

    重启solr

    关闭solr的终端,重新打开一个终端,运行java java -jar start.jar

    验证nutch

    创建urls/seed.txt,seed.txt里应该写点啥自便吧,运行java ./nutch inject urls/seed.txt

    预告

    下一篇<a>nutch2.2.1与hbase1.1.1的坑爹版本问题</a>

    相关文章

      网友评论

          本文标题:nutch2.2.1与solr4.5.1的整合

          本文链接:https://www.haomeiwen.com/subject/dsbplttx.html