Beautiful
优点
不用担心编码方式的问题 ,因为已经内置处理好了,会自动将输入文档转换Unicode编码,输出转换UTF-8编码
#基本用法

#选择元素
- 通过标签选择
- 通过CSS选择器选择
- 获取属性
attrs
- 获取文本
get_text()
- 获取属性
- 方法选择器
-
find()
返回单个元素 find_parents()
find_parent()
find_next_siblings()
find_next_siling()
-

#提取信息
- 获取标签信息
name
字符串 - 获取文本信息
string
字符串 - 获取属性信息
attrs
字典

#嵌套选择
print(soup.head.title)
#关联选择
- 子节点与子孙节点
contents/children | descendants
- 父节点与祖先节点
parent| parents
- 兄弟节点
-
next_sibling
下一个兄弟节点 -
next_siblings
所有后面的兄弟节点 -
previous_sibling
上一个兄弟节点 -
previous_siblings
所有前面的兄弟节点
-
网友评论