前言
这篇博客是建立在上一篇<a href="http://www.jianshu.com/p/5e30a6f24d59">ubuntu15.10下nutch2.2.1+mysql搭建爬虫平台</a>基础上的。劝懵逼的小伙伴看一下。
nutch配置的区别
- 修改conf/nutch-site.xml
<property>
<name>storage.data.store.class</name>
<value>org.apache.gora.hbase.store.HBaseStore</value>
<description>Default class for storing data</description>
</property>
- 修改 conf/gora.properties
gora.datastore.default=org.apache.gora.hbase.store.HBaseStore
gora.sqlstore.jdbc.driver=org.hsqldb.jdbc.JDBCDriver
gora.sqlstore.jdbc.url=jdbc:hsqldb:hsql://localhost/nutchtest
gora.sqlstore.jdbc.user=youth
gora.sqlstore.jdbc.password=
- 修改ivy/ivy.xml
<dependency org="org.apache.gora" name="gora-hbase" rev="0.3" conf="*->default" />
####结语
剩下的又是漫长的等待,这个月想自己建一个maven,把常用的jar都放进去
####预告
下一篇<a href="http://www.jianshu.com/p/4979d6eb4ea7">nutch2.2.1与solr4.5.1的整合</a>
网友评论