美文网首页
windows 下安装python 爬虫

windows 下安装python 爬虫

作者: AlastairYuan | 来源:发表于2018-11-07 23:05 被阅读0次

    1.在网上下载python3.6 64位的安装包可执行文件, 双击安装(一定要是64位的,后面安装tensorflow 需要64位)

    2.配置环境变量, 找到python.exe 和 pip.exe两个文件的路径,添加到环境变量中

    3.在pycharm中选择已经配置好的环境变量, 百度解决

    4.下载https://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted

    Twisted-18.9.0-cp36-cp36m-win32.whl

    Twisted-18.9.0-cp36-cp36m-win_amd64.whl

    pip install Twisted-18.9.0-cp36-cp36m-win_amd64.whl

    pip install scipy-1.1.0-cp36-cp36m-win_amd64.whl

    参考https://www.cnblogs.com/qxfan/p/8566945.html

    5.在cmd命令行中输入pip install scrapy 安装scrapy框架,可能报错,百度解决

    6.打开我发的项目, 看看各个文件中有哪些导入的包下面有红线, 有红线的包需要通过pip install 包名进行安装

    7.运行项目的话是在下方的Terminal里面输入scrapy crawl akc  (akc)是我这个爬虫的名字

    或者打开我自己创建的run_akc 文件 然后右键run

    pip install PyMySQL

    pip install lxml

    pip install bs4

    pip install cryptography --force-reinstall

    pip install UserAgent

    pip install fake-useragent

    pip install pywin32

    pip install bloomfilter4py3

    pip install requests

    pip install pandas

    python -m pip install --upgrade pip

    pip install numpy 

    pip install matplotlib

    https://www.microsoft.com/en-us/download/confirmation.aspx?id=53587

    安装 vc_redist.x64.exe

    8.项目的各个文件的作用百度上面都有, spiders文件夹里面的文件是自己创建的, 解析页面逻辑的代码都写在了spiders下面的文件夹里面, 一个文件就是一个爬虫项目


    ====================

    pip list

    Package Version

    ---------------- ---------

    APScheduler      3.2.0   

    asn1crypto      0.24.0 

    atomicwrites    1.2.1   

    attrs            18.1.0 

    Automat          0.7.0   

    beautifulsoup4  4.6.3   

    bloom-filter    1.3     

    BloomFilter      0.1.0   

    bloomfilter4py3  1.1.1   

    boos            0.5.3   

    boost            0.1     

    boto            2.49.0 

    boto3            1.9.22 

    botocore        1.12.22 

    bs4              0.0.1   

    bz2file          0.98   

    certifi          2018.8.24

    cffi            1.11.5 

    chardet          3.0.4   

    click            6.7     

    colorama        0.3.9   

    constantly      15.1.0 

    cryptography    2.3.1   

    cssselect        1.0.3   

    decorator        4.3.0   

    Django          2.1.2   

    docutils        0.14   

    fake-useragent  0.1.10 

    Flask            0.12   

    gensim          3.6.0   

    http-ece        1.0.5   

    hyperlink        18.0.0 

    idna            2.7     

    incremental      17.5.0 

    itsdangerous    0.24   

    Jinja2          2.10   

    jmespath        0.9.3   

    lxml            4.2.1   

    MarkupSafe      1.0     

    Mastodon.py      1.3.1   

    more-itertools  4.3.0   

    nibabel          2.3.0   

    nltk            3.3     

    numpy            1.15.1 

    pandas          0.23.4 

    parsel          1.5.0   

    pdfminer.six    20170720

    pdfminer3k      1.3.1   

    Pillow          5.2.0   

    pip              18.0   

    plac            1.0.0   

    pluggy          0.7.1   

    ply              3.11   

    py              1.6.0   

    py3bitlist      1.1.3   

    pyasn1          0.4.4   

    pyasn1-modules  0.2.2   

    pybloomfilter    1.0     

    pycparser        2.18   

    pycryptodome    3.6.6   

    PyDispatcher    2.0.5   

    PyExecJS        1.5.1   

    PyHamcrest      1.9.0   

    pymongo          3.7.1   

    PyMySQL          0.9.2   

    pyOpenSSL        18.0.0 

    pypiwin32        223     

    pytest          3.7.4   

    python-dateutil  2.7.3   

    pytz            2018.5 

    pywin32          223     

    queuelib        1.5.0   

    redis            2.10.6 

    requests        2.12.4 

    s3transfer      0.1.13 

    scipy            1.1.0   

    Scrapy          1.5.1   

    scrapy-redis    0.6.8   

    scrapy-splash    0.7.2   

    selenium        3.14.0 

    service-identity 17.0.0 

    setuptools      28.8.0 

    six              1.11.0 

    smart-open      1.7.1   

    SQLAlchemy      1.2.11 

    Twisted          18.7.0 

    tzlocal          1.5.1   

    unicodecsv      0.14.1 

    urllib3          1.23   

    w3lib            1.19.0 

    Wand            0.4.4   

    Werkzeug        0.11.15 

    xlrd            1.1.0   

    xlwt            1.3.0   

    zope.interface  4.5.0   

    相关文章

      网友评论

          本文标题:windows 下安装python 爬虫

          本文链接:https://www.haomeiwen.com/subject/wjjhqxtx.html