BeautifulSoup的使用笔记

BeautifulSoup的使用笔记

作者: 一言不合就跑步 | 来源:发表于2018-10-08 10:04 被阅读0次

Python实战 - 第2节：解析网页中的元素
爬虫任务二
BeautifulSoup(BS4)的基本使用
BeautifulSoup的使用笔记
Python中HTML解析
爬虫学习一
HTML 解析
【爬虫】-001-使用BeautifulSoup解析网页
BeautifulSoup
python使用beautifulsoup爬虫笔记

1.创建对象

创建对象

soup = BeautifulSoup(html,'lxml')

格式化对象

soup.prettify()

2.对象的四种类型

BeautifulSoup将html转换成树状结构，所有对象可以归纳为4种：

Tag
标签，例如：soup.a/soup.p

tag有两个重要的属性，name和attrs
- name就是名字
- 属性类似于字典，可以写成soup.p.attrs得到一个字典，或者像字典一样取值soup.p['class'],也可以写成soup.p.get['class']
- 可以对属性进行修改和删除
NavigableString

获取标签之中的内容，可以写成soup.p.string
BeautifulSoup

BeautifulSoup是一个大的Tag
Comment

类似于NavigableString ，只是类型不同

3.遍历文档

目前没有用到，先不看了。

4. 搜索文档树

find_all（name,attrs,recursive,text,**kwargs)
- name
  
  查找所有tag的name
```
字符，正则表达式，列表，方法，布尔
```
- **kwargs
  
  传入tag的属性
- text
  
  检索文档内容
- recuisive
  
  是搜索所有子孙节点还是当前节点

相关文章

Python实战 - 第2节：解析网页中的元素
笔记爬取网页的基本方法：使用BeautifulSoup解析网页Soup = BeautifulSoup(htm...
爬虫任务二
2.1 学习beautifulsoup 学习beautifulsoup，并使用beautifulsoup提取内容。...
BeautifulSoup(BS4)的基本使用
一、BeautifulSoup简介二、BeautifulSoup安装三、BeautifulSoup基本使用导...
BeautifulSoup的使用笔记
1.创建对象创建对象 soup = BeautifulSoup(html,'lxml') 格式化对象 soup....
Python中HTML解析
BeautifulSoup 安装使用更多 https://beautifulsoup.readthedocs....
爬虫学习一
1.使用BeautifulSoup库解析网页 from bs4 import BeautifulSoup 2.使用...
HTML 解析
pyquery 使用参考 beautifulsoup4 beautifulsoup4同上为
【爬虫】-001-使用BeautifulSoup解析网页
1.使用BeautifulSoup+requests解析网页 1）BeautifulSoup Beautiful ...
BeautifulSoup
导入使用 from bs4 import BeautifulSoup soup = BeautifulSoup(h...
python使用beautifulsoup爬虫笔记
嵌套抓取子元素

网友评论

本文标题：BeautifulSoup的使用笔记

本文链接：https://www.haomeiwen.com/subject/jhedaftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|BeautifulSoup的使用笔记|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！