美文网首页
1. Beautiful Soup的简介

1. Beautiful Soup的简介

作者: 门前一条小河流 | 来源:发表于2018-05-30 09:48 被阅读0次

    1. Beautiful Soup的简介

    简单来说,Beautiful Soup是python的一个库,最主要的功能是从网页抓取数据。官方解释如下:

    Beautiful Soup提供一些简单的、python式的函数用来处理导航、搜索、修改分析树等功能。它是一个工具箱,通过解析文档为用户提供需要抓取的数据,因为简单,所以不需要多少代码就可以写出一个完整的应用程序。

    Beautiful Soup自动将输入文档转换为Unicode编码,输出文档转换为utf-8编码。你不需要考虑编码方式,除非文档没有指定一个编码方式,这时,Beautiful Soup就不能自动识别编码方式了。然后,你仅仅需要说明一下原始编码方式就可以了。

    Beautiful Soup已成为和lxml、html6lib一样出色的python解释器,为用户灵活地提供不同的解析策略或强劲的速度。

    2. Beautiful Soup 安装

    Beautiful Soup 3 目前已经停止开发,推荐在现在的项目中使用Beautiful Soup 4,不过它已经被移植到BS4了,也就是说导入时我们需要 import bs4 。所以这里我们用的版本是 Beautiful Soup 4.3.2 (简称BS4),另外据说 BS4 对 Python3 的支持不够好,不过我用的是 Python2.7.7,如果有小伙伴用的是 Python3 版本,可以考虑下载 BS3 版本。

    可以利用 pip 或者 easy_install 来安装,以下两种方法均可

    easy_install beautifulsoup4

    pip install beautifulsoup4

    相关文章

      网友评论

          本文标题:1. Beautiful Soup的简介

          本文链接:https://www.haomeiwen.com/subject/lkctsftx.html