美文网首页
利用BeautifulSoup获得静态页面中的信息

利用BeautifulSoup获得静态页面中的信息

作者: 开往自由的列车 | 来源:发表于2017-07-24 10:46 被阅读0次

一、利用页面中标签的名称和属性查找标签

二、通过标签在文档中的位置来查找标签

要查找标签在一个静态页面中的位置,首先要知道“导航树”的概念。当我们用浏览器(如 ie edge)打开一个静态页面后,点击浏览器右上角的“更多”时,会出现“开发人员工具”选项,点击后就可以看到页面的html代码了,它是以一棵树的形式存在的,我们管它叫“导航树”。

1、子标签

这里只说思想不写代码(实在是因为编辑器写代码太魔怔了),子标签就是父标签的下一层,比如table标签,它的下一层子标签就是 所有的tr标签,那么tr标签中所有内容,包括标签也会被打印出来

2、兄弟标签(包括next_siblings 和 previous_siblings)

兄弟标签就是和这个标签具有相同名字的标签(不包含它自己)

3、如何找父亲标签

父亲标签和子标签是对应的,就是子标签的上一层标签。

相关文章

  • 利用BeautifulSoup获得静态页面中的信息

    一、利用页面中标签的名称和属性查找标签 二、通过标签在文档中的位置来查找标签 要查找标签在一个静态页面中的位置,首...

  • 爬虫从零开始--爬取静态网站

    利用BeautifulSoup爬取静态html网站 例子:爬取quner网站信息 查看网页源码发现,景点名称西湖t...

  • 爬取京东商品信息

    利用 BeautifulSoup + Requests 爬取京东商品信息并保存在Excel中 一、查看网页信息 打...

  • 简单静态网站的爬取

    利用BeautifulSoup以及requests爬取静态网站http://seputu.com/的标题、章节、章...

  • 利用python爬取城市公交站点

    利用python爬取城市公交站点 页面分析 爬虫 我们利用requests请求,利用BeautifulSoup来解...

  • Python爬虫 豆瓣动态页面的爬取

    动态页面和静态页面可通过检查元素查看爬取的信息和查看源代码中的信息是否一致,一致则为静态页面,反则为动态页面。因为...

  • BeautifulSoup之爬静态界面

    小注:今天可算是学会简书的markdown切换了。点击上面“预览模式”。 BeautifulSoup爬取静态页面套...

  • 作品汇总

    这是我做的作品跟Demo汇总,希望您能够喜欢 贸易商城的页面静态页面一静态页面二静态页面三利用AJAX做的加载更多...

  • 说说如何利用 Python 的 BeautifulSoup 模块

    BeautifulSoup 是 Python 的一个模块,用于从 HTML 页面中提取信息。 首先在命令行中运行 ...

  • python搜索汽车票

    一、背景 利用Requests模块获取页面,BeautifulSoup来获取需要的内容,处理并返回结果。 二、代码...

网友评论

      本文标题:利用BeautifulSoup获得静态页面中的信息

      本文链接:https://www.haomeiwen.com/subject/ieuukxtx.html