美文网首页
用python写爬虫-1.爬虫步骤

用python写爬虫-1.爬虫步骤

作者: ddm2014 | 来源:发表于2018-03-31 15:59 被阅读0次

    写爬虫有几步?

    1.找到想要爬取的数据地址。

    我用chrome浏览器,F12。

    一般在doc或者xhr下,doc是网址上就有的内容,xhr是js异步的数据。

    再看看Headers,Request URL,这就是请求地址。

    下面有网页的方法,一般为get或者post

    用response看看想爬的数据在不在,这是最关键的一步,找到想要的数据在哪里。

    2. 用requests获取网页,

    3. beautifulSoup,pyquery等库解析网页,将想要的数据抽取出来。

    4.将抽取出来的数据保存。存入excel,数据库,以便后续使用。

    下一次requests库

    相关文章

      网友评论

          本文标题:用python写爬虫-1.爬虫步骤

          本文链接:https://www.haomeiwen.com/subject/wtmicftx.html