美文网首页
【scrapy】爬虫学习杂记

【scrapy】爬虫学习杂记

作者: 是Jonathan | 来源:发表于2017-03-29 14:49 被阅读20次

    Linux下安装Scrapy
    Ubuntu 16.04 LTS
    Python 2.7
    Scrapy依赖环境
    sudo apt-get install python-dev
    sudo apt-get install libevent-dev
    sudo apt-get install libssl-dev

    https://doc.scrapy.org/en/1.3/intro/tutorial.html#creating-a-project

    Windows下的错误
    执行scrapy shell时报错
    ImportError: No module named win32api

    No module named win32api错误截图

    pywin32下载链接:
    https://sourceforge.net/projects/pywin32/files/pywin32/Build%20220/

    Paste_Image.png

    更改PIP源
    使用豆瓣源:
    pip -i https://pypi.douban.com/simple XXXX

    安装virtrualenv和virtualenvwrapper-win基本使用
    1.创建Python3的虚拟环境
    virtualenv VIRTUALENV_NAME --python=PYTHON_PATH
    example: virtualenv TEST --python=D:\Python35\python.exe
    创建Python2的环境同样。
    2.激活虚拟环境
    Windows下:
    VIRTUALENV_NAME_PATH\Scripts\activate
    D:\PycharmProjects\TEST\Scripts\activate
    退出虚拟环境:
    VIRTUALENV_NAME_PATH\Scripts\deactivate.bat
    D:\PycharmProjects\TEST\Scripts\deactivate.bat
    py -2 -m pip install virtualenvwrapper-win
    mkvirtualenv --python=D:\Python35\python.exe articles35
    退出虚拟环境:
    deactivate
    no module win32api错误
    pip install pypiwin32

    XPath语法

    Paste_Image.png Paste_Image.png

    css选择器

    Paste_Image.png

    相关文章

      网友评论

          本文标题:【scrapy】爬虫学习杂记

          本文链接:https://www.haomeiwen.com/subject/iosdottx.html