美文网首页
python通过re、xpath、beautiful soup三

python通过re、xpath、beautiful soup三

作者: Linvisf | 来源:发表于2019-05-26 23:11 被阅读0次

python解析网页有很多种方法,下面介绍三种方法:

1、正则表达式:re

2、xpath

3、beautiful soup

首先先获取网页源代码,可以通过requests方式获取

requests获取网页源代码

接下来对网页源代码部分截图进行解析,我们目标是提取小说所有章节网址,如下图所示:

网页截图

1、通过正则表达式:re 提取每章网址

re方式解析 re方式提取结果显示

2、通过xpath方式: 提取每章网址

xpath方法解析 xpath方法解析提取数据结果

3、通过beautiful soup方式: 提取每章网址

beautiful soup方法解析 soup解析提取数据结果显示

相关文章

网友评论

      本文标题:python通过re、xpath、beautiful soup三

      本文链接:https://www.haomeiwen.com/subject/lohqtctx.html