爬虫1

作者: Rain师兄 | 来源:发表于2020-09-29 14:33 被阅读0次

我太机智了,一开始不知道怎么翻页查找,python才开始学,突然发现一个很好用的办法

用爬虫爬取笑话的时候,想了很久不知道怎么模拟翻页,也就是只能手动一次换一个网址,很麻烦。

后来发现,网页和网页之间的区别就差了几个数字。

比如    

http://xiaohua.zol.com.cn/lengxiaohua/2.html

http://xiaohua.zol.com.cn/lengxiaohua/3.html

只有数字不同

所以我可以把数字分离出来,把网址分成三段,三个字符串

‘’http://xiaohua.zol.com.cn/lengxiaohua/“    + str(number)   +".html"

然后用for 循环看看网页有多少次就重复多少次。

就解决了手动换网址的问题,但是还有一些问题。不过至少能把笑话都打出来了。

源代码

import requests

from bs4 import BeautifulSoup as bf

if __name__ =='__main__': 

        for t in range(2,20):

                url = 'http://xiaohua.zol.com.cn/lengxiaohua/'+str(t)+'.html'

                headers = {'User-Agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.102 Safari/537.36'}

                 html = requests.get(url,headers=headers)

                 html_text = html.text

                 soup = bf(html_text,'lxml')

                 texts = soup.findAll('p')

                 for i in texts:

                          print(i.get_text())

相关文章

  • python-爬虫基础(慕课网)

    二.爬虫简介以及爬虫的技术价值 2-1:爬虫是什么? 2-2:爬虫技术的价值? 三.简单爬虫架构 3-1:简单爬虫...

  • 7.爬虫概述

    爬虫概述 知识点: 了解 爬虫的概念 了解 爬虫的作用 了解 爬虫的分类 掌握 爬虫的流程 1. 爬虫的概念 模拟...

  • 爬虫001

    爬虫概述 ——骑猪追火车 1、目录清单 1、爬虫简介 2、通用爬虫和聚焦爬虫 3、网络请求是怎么回事儿 4、网络数...

  • 2018-05-13

    Scrapy爬虫 1.新建爬虫工程 scrapy startproject Spider(项目名字) 2.创建爬虫...

  • 3分钟带你了解世界第一语言Python 入门上手也这么简单!

    一、Python入门 1. Python爬虫入门一之综述 Python爬虫入门二之爬虫基础了解 Python爬虫入...

  • 爬虫01:概述

    爬虫概述 1.目录清单 爬虫简介 通用爬虫和聚焦爬虫 网络请求那些事儿 网络数据抓包分析 2.章节内容 2.1爬虫...

  • Python爬虫简述系列之一

    1,简单分类 根据使用场景,网络爬虫可分为 通用爬虫 和 聚焦爬虫 两种. 2,通用爬虫 通用网络爬虫 是 捜索引...

  • 爬虫原理与数据抓取(一)

    通用爬虫与网络爬虫 1.通用爬虫 通用网络爬虫 是 捜索引擎抓取系统(Baidu、Google、Yahoo等)的重...

  • 2018-01-11 Python网络爬虫与信息提取 网络爬虫

    1、网络爬虫 1.1 网络爬虫的尺寸网络爬虫的尺寸 1.2 网络爬虫的“骚扰”网络爬虫速度快(但是服务器是按照人数...

  • http与https网络请求

    1.爬虫介绍 爬虫spider,获取数据的一种方式,根据使用场景,网络爬虫可分为 通用爬虫 和 聚焦爬虫 两种. ...

网友评论

      本文标题:爬虫1

      本文链接:https://www.haomeiwen.com/subject/xfreuktx.html