美文网首页
部署爬虫-kafka手顺

部署爬虫-kafka手顺

作者: Captain_tu | 来源:发表于2017-12-28 14:42 被阅读40次
    1. 安装redis

       wget http://download.redis.io/releases/redis-4.0.6.tar.gz
       tar -zxf redis-4.0.6.tar.gz && cd redis-4.0.6
       make && make install
       cp redis.conf /etc/redis.conf
       #修改配置文件,配置后台启动redis
       redis-server /etc/redis.conf
      
    2. 安装NodeJs

       wget https://npm.taobao.org/mirrors/node/v8.9.3/node-v8.9.3-linux-x64.tar.xz
       xz -d node-v8.9.3-linux-x64.tar.xz
       tar -xf node-v8.9.3-linux-x64.tar
       #将nodejs加入到环境变量
       export PATH=$PATH:/usr/local/nodejs/bin
      
    3. 安装scrapy

       yum install python-devel
       wget https://bootstrap.pypa.io/get-pip.py
       python get-pip.py
       
       pip install scrapy
       #安装其他依赖
       pip install python-donenv
       pip install py-mysql
       pip install py-kafka
       pip install requests
       ......
      
    4. 启动node爬虫

      • 进入项目根目录,复制config.dev.js=>config.js
      • 修改配置文件中的 redis,kafka地址
      • node daemon.js app/jin10 启动爬虫,如果成功,则使用nohup后台运行

    相关文章

      网友评论

          本文标题:部署爬虫-kafka手顺

          本文链接:https://www.haomeiwen.com/subject/juxvgxtx.html