相信大家都有遇到这种情况(无法复制):
image或者是这种情况
image以上这种情况都是网页无法复制文本的情况。不过这些对于Python来说都不是问题。今天辰哥就叫你们用Python去解决。
思路:利用pdfkit库将html网页保存为pdf
01、小案例
1、安装pdfkit库
pip install pdfkit
通过命令安装pdfkit,此外还需要安装exe文件(wkhtmltopdf)。
下载链接:https://wkhtmltopdf.org/downloads.html
image
选择对于的版本下载并安装(记住自己的安装目录)
2、小案例
先看一下这个网页(辰哥自己的网页:www.chenlove.cn)
image目标:将这个网页保存为pdf
import pdfkit
其中的config就是上面安装的wkhtmltopdf的路径。
效果:
image可以看到,我们已经成功将这个网页保存为pdf
下面我们开始尝试禁止复制的网页。
02、实战
1、目标网站
这里我们现在简书平台的其中一篇文章进行测试(文章设置了禁止复制)
image比如我要进行复制的时候,同时禁止转载(不让复制),下面开始将这个网页保存pdf。
import pdfkit
image
这样将内容保存为pdf就可以直接进行复制了。
感兴趣的小伙伴,可以尝试其他的网页(你懂得)
03、小结
本文的讲解就到这里,内容主要是将网页保存为pdf,对于其他禁止复制的网页、长网页等都可以保存为pdf。大家下去可以去自己尝试。
一定要动手尝试 !一定要动手尝试 !一定要动手尝试!
网友评论