爬虫估量许多人晓得,能够主动下载一些网站上面的图片,视频,这边说下应用FileManager和爬虫创立影音、图片库,并分享几个美人站爬虫(1024/mm131/91/mmjpg)。想看美人的能够爬来看看。至于其他念书材料网站的爬虫,能够去Github上找找。
截图
应用教程
爬虫应用python3+requests库编写,在Windows体系和Linux体系下都能够运转,大有些Ubuntu、Debian都含有Python3,径直安装最新此体系便可以了。而CentOS必要分外安装Python3,这边只说下CentOS 7体系应用方式。
1、安装FileManager网盘
教程参考:使用Caddy扩大快速安装FileManager自己人网盘/在线文献管理器。
2、查抄Python3并晋级
检察Python3能否安装
python3 -V
如其返回-bash: python3: command not found,就应用Python 3.6一键脚本举行安装:
wget https://www.moerats.com/usr/shell/Python3/CentOS_Python3.6.sh && sh CentOS_Python3.6.sh
本脚本包罗很多必须库,不会由于缺乏依靠而出成绩,如其不想用脚本的,也能够手动晋级,教程参考:Linux CentOS晋级Python 3.6版本方式。
3、安装requests库
pip3 install requests
4、创办文献夹
mkdir /usr/local/caddy/www/file/xx #用来存储文献
cd /usr/local/caddy/www/file/xx
5、下载并运转爬虫
#91视频爬虫,默许只爬精粹前100页,修正while flag<=100便可变动页码。
wget https://www.moerats.com/usr/shell/Python3/91_spider.py && python3 91_spider.py
#1024图片爬虫
wget https://www.moerats.com/usr/shell/Python3/1024_spider.py && python3 1024_spider.py
#mm131图片爬虫
wget https://www.moerats.com/usr/shell/Python3/mm131_spider.py && python3 mm131_spider.py
#mmjpg图片爬虫
wget https://www.moerats.com/usr/shell/Python3/mmjpg.py && python3 mmjpg.py
提议应用screen后盾操纵,参考:应用screen来完成多使命不竭线操纵号令。最末进入FileManager网盘问看便可。
网友评论