美文网首页
用python写爬虫--2.1requests库例子

用python写爬虫--2.1requests库例子

作者: ddm2014 | 来源:发表于2018-03-31 21:48 被阅读0次

    这次看个例子,最简单的情况,所见即所得的get。

    什么值得买的发现/现在叫好价频道,网址是https://faxian.smzdm.com/

    第一步,找到自己需要的信息。我想把值得买每一页的title和价格爬下来,如图。

    老规矩,还是F12,

    看看信息在哪里

    发现果然在doc下网站https://faxian.smzdm.com/的网页里。

    第二步就可以开始写程序爬下来了

    ```

    import requests

    re= requests.get('https://faxian.smzdm.com/')

    print(re.text)

    ```

    发现返回乱码,body里没有想要的东西

    这应该是网站做了反爬虫的,很简单,将get里加入参数headers,试试能不能解决问题。headers是将爬虫伪装成普通浏览器

    ```

    import requests

    head = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/61.0.3163.100 Safari/537.36'}

    re= requests.get('https://faxian.smzdm.com/',headers = head)

    print(re.text)

    ```

    看起来好了返回了具体的优惠信息。

    下一次看看解析网页

    相关文章

      网友评论

          本文标题:用python写爬虫--2.1requests库例子

          本文链接:https://www.haomeiwen.com/subject/mcogcftx.html