美文网首页
Scrapy+Scrapyd+Logparser+Pyodbc在

Scrapy+Scrapyd+Logparser+Pyodbc在

作者: 黑帽里 | 来源:发表于2019-09-29 09:46 被阅读0次

国内PIP镜像源

https://pypi.tuna.tsinghua.edu.cn/simple

1. 如果是拨号VPS,设置拨号账号

[root@localhost ~]# PPPoE-Setup
...
[root@localhost ~]# ip address
...
[root@localhost ~]# pppoe-start
...

2.安装Python3.6

[root@localhost ~]# yum install -y epel-release
...
[root@localhost ~]# yum install -y python36
...
[root@localhost ~]# python3 -V
Python 3.6.8

3. 更新pip3为最新版本,并修改默认镜像源

[root@localhost ~]# pip3 install --upgrade pip
Installing collected packages: pip
Successfully installed pip-19.2.3
[root@localhost ~]# mkdir .pip
[root@localhost ~]# cd .pip
[root@localhost .pip]# vi pip.conf

[global]
timeout = 6000
index-url=https://pypi.tuna.tsinghua.edu.cn/simple
trusted-host = pypi.tuna.tsinghua.edu.cn


4. 安装系统依赖工具包

[root@localhost ~]# pip3 install bs4
...
[root@localhost ~]# pip3 install scrapy==1.6.0
...
其他你自己的爬虫需要引用的第三方包

5. 安装MS SQL SERVER 数据库驱动

[root@localhost ~]# curl https://packages.microsoft.com/config/rhel/7/prod.repo > /etc/yum.repos.d/mssql-release.repo
...
[root@localhost ~]# yum install unixODBC  -y
[root@localhost ~]# yum install msodbcsql17 -y
...
视情况安装mysql odbc
[root@iZbp108zipn94hwfsywfxyZ ~]# yum install https://www.devart.com/odbc/mysql/devart-odbc-mysql.x86_64.rpm

6. 安装数据库访问组件pyodbc

[root@iZbp108zipn94hwfsywfxyZ ~]# yum install gcc-c++
[root@iZbp108zipn94hwfsywfxyZ ~]# yum install python36-devel
[root@iZbp108zipn94hwfsywfxyZ ~]# yum install unixODBC-devel
...
[root@localhost ~]# pip3 install  pyodbc
...

7. 配置并启动Scrapyd服务

[root@localhost scrapyd]# pip3 install scrapyd
...
[root@localhost log]# cd /var/log
[root@localhost log]# mkdir scrapyd
[root@localhost log]# cd scrapyd
[root@localhost scrapyd]# mkdir logs
[root@localhost scrapyd]# mkdir eggs
[root@localhost scrapyd]# mkdir dbs

[root@localhost scrapyd]# cd /etc/scrapyd
没有此路径就创建
[root@localhost scrapyd]# vi scrapyd.conf

[scrapyd]
eggs_dir   = /var/log/scrapyd/eggs
logs_dir    = /var/log/scrapyd/logs
items_dir  =/var/log/scrapyd/items
jobs_to_keep = 5
dbs_dir     = /var/log/scrapyd/dbs
max_proc    = 0
max_proc_per_cpu = 4
finished_to_keep = 100
poll_interval = 5.0
bind_address = 0.0.0.0
http_port   = 63800
debug       = off
runner      = scrapyd.runner
application = scrapyd.app.application
launcher    = scrapyd.launcher.Launcher
webroot     = scrapyd.website.Root
...
[root@localhost scrapyd]# nohup scrapyd
...

8. 配置并启动logparser

[root@localhost ~]# pip3 install logparser
...
[root@localhost ~]# cd /usr/local/lib/python3.6/site-packages/logparser
[root@localhost logparser]# vi settings.py
修改以下两处配置
SCRAPYD_LOGS_DIR = '/var/log/scrapyd/logs'
SCRAPYD_SERVER = '127.0.0.1:63800'
[root@localhost ~]# nohup logparser

9. 开放63800端口

添加指定需要开放的端口
[root@localhost ~]# systemctl start firewalld.service
[root@localhost ~]# firewall-cmd --add-port=63800/tcp --permanent
...
重载入添加的端口:
[root@localhost ~]# firewall-cmd --reload
...
查询指定端口是否开启成功:
[root@localhost ~]# firewall-cmd --query-port=63800/tcp
...

10. 检查服务是否启动,并终止任务的运行

[root@localhost ~]# ps -ef|grep scrapyd
...
[root@localhost ~]# ps -ef|grep logparser
...
终止进程
[root@localhost ~]# kill -s 9 4056
...

相关文章

  • Scrapy+Scrapyd+Logparser+Pyodbc在

    国内PIP镜像源 https://pypi.tuna.tsinghua.edu.cn/simple 1. 如果是拨...

  • 《在 在 在》

    在荒凉的海滩边, 在无边无垠的旷野上, 在茂密、阴森而诡诘的森林里, 赤身裸体, 肌肤光明, 两人不死不休的做爱…...

  • 在 在 在

  • 在长大,在失去,在努力,在接受

    小时候不懂得长大的意义,一直盼着长大,但是长大后你会发现,长大的代价太过昂贵,长大的你会失去很多东西,但是你还不得...

  • 在长大、在接受、在失去、在成长

    而立之年,转身、回眸,每一次尝试,都是成长路上必经的驿站。 第一站 童年的记忆里,我是一个很同龄人不一样的小孩,没...

  • 山在 海在 岁月在 我在

    ——卓夫文暄 混职场的社畜且不论菜鸟老鸟 大多聪明又精明且又心思缜密 他们的牙齿如刺似箭,他们的舌头是快刀 闽和南...

  • 眼在、耳在、手在、神在

    我有个同事的好朋友,她儿子从上小学开始,学习就非常让她头疼,作业几乎不会做,每次她都要重新把知识讲一遍,然后才能继...

  • 在!在!还在!

    儿子两岁前,我们住在平洲,离现在住的地方差不多10公里。儿子小的时候,爷爷经常带着他去附近的平洲公园玩。最近...

  • 在路上,在思考,在挣扎

    80后的我们,青春早已逝去,不再轻狂,不再洒脱,不再微笑......在一些过后,我们有的更多的是在于生活中...

  • 我在     山在      大地在。

    岁月在。我在。你还要怎样更好的世界

网友评论

      本文标题:Scrapy+Scrapyd+Logparser+Pyodbc在

      本文链接:https://www.haomeiwen.com/subject/mqmpuctx.html