-
lxml
:一种高效的XML和HTML解析器。安装 scrapy 框架也是需要用到它。但是,当lxml遇上Windows,简直是个巨坑。为此,我找了很多资料,终于在我不懈的努力下,爬出来了。以此文来记录我的踩坑经历,便于日后回顾以及帮助遇到此问题的其他小伙伴少走些弯路。 -
前提:已安装
python
、pip
。(我的其他文章中有讲到)。 -
问题:运行
pip install lxml
命令报错,无法正常安装lxml
。如果安装成功的话,可以不用往下看了,人品太好了。通常呢,都会遇到各种错误。
解决方法:通过lxml的.whl文件来进行安装。
- 打开cmd,输入
pip install wheel
,先安装wheel库了才能安装.whl文件。 - 在 https://pypi.org 网站下载
.whl
文件,然后通过命令进行安装,如下图所示。(Desktop是桌面文件夹,dd是我在桌面新建的文件夹,用于放置 .whl 文件)
命令行安装 lxml - 安装成功之后会在
D:\software\python\Lib\site-packages
文件地址下有安装包,因为D:\software\python
是我的python解析器安装位置。
lxml安装位置 -
进入python,输入import lxml,未报错,即表示安装成功。
安装成功
- 虽然 命令行安装成功了,但
pyCharm
中还是安装不成功,如图所示:
依然提示先去命令行安装
项目依赖--lxml安装位置问题:项目环境中依然没有安装包。
项目依赖文件夹地址
解决方案:我准备复制一份过去,先找到项目依赖的文件夹(如下图所示),接着将上图红框框住的文件夹复制一份,放到项目文件夹中。
- 成功解决: 成功安装
lxml
之后,爬取了小说网站其中一篇小说的第一章,并保存了下来。
爬虫代码
爬取的小说
网友评论