-
安装BeautifulSoup
使用管理员模式进行pip下载安装
pip install beautifulsoup4
此时安装的模块所在的路径为:C:\Program Files\Python36\Lib\site-packages
-
导入BeautifulSoup
from bs4 import BeautifulSoup
-
使用基本语句
demo = r. text # 其中r为通过requests获取的信息
soup = BeautifulSoup(demo,"html.parser")
print(soup.prettify())
Beautiful Soup库解析器
此时soup可以作为一个BeautifulSoup类,该类作为html或者xml文档的全部内容。
Beautiful Soup类的基本元素
soup.title # soup的title标签
soup.a # soup的a标签
soup.a.name # 标签a的名字
soup.a.attrs #字典格式的属性列表
soup.a.string # 非属性字符串
# 注释中的string与一般标签相同,只显示字符串,
# 无法区分,可以使用type来区分
type(soup.a.string) # <class 'bs4.element.NavigableString'>
type(soup.b.string) #<class 'bs4.element.Comment'>
基本元素
网友评论