美文网首页python爬虫
BeautifulSoup库用法总结

BeautifulSoup库用法总结

作者: Wayne_Dream | 来源:发表于2018-06-02 14:44 被阅读62次

0.写在前面

在python的爬虫中,经常需要用到强大的beautifulsoup库,如之前写的股票数据的爬取中就用到了它。在这里,将详细总结beautifulsoup的用法,来巩固相关知识。以下便是我从各种网站搜集的资料,在这里做一个汇总。(我从不生产知识,我只是知识的搬运工)

1.基本介绍

beautifulsoup

2.安装/引用

安装:win平台中‘以管理员身份运行’cmd,执行pip install beautifulsoup4即可安装
引用:from bs4 import BeautifulSoupimport bs4即可

3.使用方法

先煲制一锅汤
解析器 基本元素
对应各元素
一个用于接下来分析的demo
tag标签
tag.name
attrs
string
comment
如果不想输出内容的注释,可以写一个if语句:
if type(newsoup.b.string)==element.Comment:
    print (newsoup.b.string)

bs4库将任何HTML输入都变成utf-8编码,python3.x默认支持编码是utf-8编码,解析无障碍

beautifulsoup库基本入门 HTML基本格式 标签树的下行遍历 标签树的上行遍历
标签树的平行遍历

本文参考中国大学MOOC / kikaylee的专栏

相关文章

网友评论

  • 52_St:学习了👏👏👏

本文标题:BeautifulSoup库用法总结

本文链接:https://www.haomeiwen.com/subject/sglrsftx.html