美文网首页python学习
爬虫学习记录4-BeautifulSoup解析html语句

爬虫学习记录4-BeautifulSoup解析html语句

作者: 二傻吧 | 来源:发表于2019-01-25 13:11 被阅读0次

    1.BeautifulSoup简单介绍:

    在这里引入一个可以解读html/xml文件的包,BeautifulSoup(引入的时候从bs4中导入,安装的时候按pip install beautifulsoup来安装就可以了)

    from bs4 import BeautifulSoup

    这个BeautifulSoup库中常用的解释器有如下图:

    html.parser(解析html文件)lxml,xmlhtml5lib

    解释器 BeautifulSoup元素

    可以通过解析的soup对象直接获取对应的元素,下面将做演示:

    BeautifulSoup的使用 示例

    注释部分内容:

    注释部分内容的类型

    所以一般通过一段内容的类型是否为NavigableString来判断其是不是注释。

    相关文章

      网友评论

        本文标题:爬虫学习记录4-BeautifulSoup解析html语句

        本文链接:https://www.haomeiwen.com/subject/lbdmjqtx.html