美文网首页
python scrapy 笔记

python scrapy 笔记

作者: 任我笑笑 | 来源:发表于2018-05-08 16:56 被阅读0次

url https://anaconda.org/conda-forge/scrapy

文档 https://doc.scrapy.org/en/latest/index.html

安装

conda install -c conda-forge scrapy

跑例子

scrapy runspider xxxxxxxxxx.py

新建项目

scrapy startproject XXXXX XXXXX代表你项目的名字

小白入门

参考知乎登录 https://zhuanlan.zhihu.com/p/25672345

不过文章已经是一年前,现在是有文字验证的,不管用
理论上来说,应该是用浏览器登录后,查看cookie,然后把cookie放到代码里直接去爬

import scrapy

class Login(scrapy.Spider):

    name = 'zhihu_login'

    start_urls = ['https://www.zhihu.com' ]
    custom_settings = {'USER_AGENT': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3026.3 Safari/537.36'}


    def parse(self, response):
        formadata = {
            'password': 'xxxxxxx',
            'phone_num': 'yyyyy',
            'email': '邮箱号二选一'
        }
        return scrapy.FormRequest.from_response(
                                  url='https://www.zhihu.com/login/{}'.format('phone_num'
                                                                          if formadata['phone_num'] else 'email'), # post 的网址
                                  method="POST", # 也是默认值, 其实不需要指定
                                  response=response, 
                                  formxpath='//form[1]', # 使用第一个form, 其实就是默认的, 这里明确写出来
                                  formdata=formadata, # 我们填写的表单数据
                                  callback=self.after_login, # 登录完成之后的处理
                                  dont_click=True)

相关文章

  • python scrapy 笔记

    url https://anaconda.org/conda-forge/scrapy 文档 https://d...

  • Scrapy笔记

    Scrapy笔记 安装scrapy框架: 安装scrapy:通过pip install scrapy即可安装。 如...

  • scrapy笔记

    1 scrapy的运行原理 参考:Learning Scrapy笔记(三)- Scrapy基础Scrapy爬虫入门...

  • 2018-07-18

    [Python 3.6 安装scrapy报错 Python.h: 没有那个文件或目录] 安装scrapy的时候报错...

  • 第九章 scrapy-redis 分布式爬虫

    scrapy-redis 分布式爬虫 标签(空格分隔): python scrapy scrapy-redis 分...

  • Scrapy框架的使用

    一 . scrapy的介绍 1. 什么是scrapy? (1) Scrapy是用纯Python实现...

  • Python爬虫学习(4)Scrapy采集框架

    Scrapy入门 注意: Python版本需要为2.7 丛书编者按 :Scrapy由 Python 编写。如果刚接...

  • 爬虫-Scrapy框架使用

    Scrapy安装环境 : Python 3.6.4//安装 scrapypip3 install scrapy查看...

  • scrapy发送post请求进行登录

    --- title: scrapy发送post请求进行登录 tags: python,scrapy,爬虫 --- ...

  • Scrapy笔记

    Scrapy笔记 pip 指定源安装模块 创建Scrapy项目 创建Scrapy爬虫程序 启动Scrapy爬虫 在...

网友评论

      本文标题:python scrapy 笔记

      本文链接:https://www.haomeiwen.com/subject/mkjwrftx.html