美文网首页
Beautiful Soup解析器比较

Beautiful Soup解析器比较

作者: 逍遥_yjz | 来源:发表于2021-06-09 16:21 被阅读0次

    1.安装

    
    pip install lxml  
    
    pip install html5lib
    
    pip install beautifulsoup4
    
    

    2.比较

    各种****html****解析器的优缺点做一下对比:

    image.png

    3.总结

    从文档的优缺点汇总表中:

    1. html.parser-BeautifulSoup(markup,"html.parser")

    • 优势:包括电池,不错的速度,宽大(从Python 2.7.3和3.2开始)。

    • 缺点:不太宽大(在Python 2.7.3或3.2.2之前)

    1. lxml-BeautifulSoup(markup,"lxml")
    • 优点:非常快,宽大

    • 缺点:外部C依赖

    1. html5lib-BeautifulSoup(markup,"html5lib")
    • 优点:极为宽松,以与网络浏览器相同的方式解析页面,创建有效的HTML5

    • 缺点:非常慢,外部Python依赖

    主要区别在BeautifulSoup文档中突出显示:

    • 解析器之间的差异

    为什么您更喜欢一个解析器而不是其他解析器的基本原因:

    • html.parser-内置-不需要额外的依赖项

    • html5lib-最宽大-如果HTML损坏,最好使用它

    • lxml-最快

    相关文章

      网友评论

          本文标题:Beautiful Soup解析器比较

          本文链接:https://www.haomeiwen.com/subject/ooveeltx.html