做过前端开发的朋友们, 在个别的情况下可能需要下载人家网站上的资源啊, 看看人家网站是怎么写的之类的, 所以我们这里介绍下一个抓取网站的工具: httrack , 这里主要讲解mac 版本, window 可在这里查看.
话不多说, 我们直接开始吧
- 安装
brew install httrack
- 卸载
brew uninstall httrack
- 运行 , 在终端直接输入: httrack ,回车就可以
httrack
Enter project name :
// (请输入项目名字)
Base path (return=/Users/xxx/websites/) :
// 本地保存路径及目录,可以拖一个文件夹丢在里面,就会将抓取到的网站放在同一文件夹下面
Enter URLs (separated by commas or blank spaces) :
// 你要抓取的网站
Action:
1 Mirror Web Site(s)
2 Mirror Web Site(s) with Wizard
3 Just Get Files Indicated
4 Mirror ALL links in URLs (Multiple Mirror)
5 Test Links In URLs (Bookmark Test)
0 Quit
1镜像网站
2带有向导的镜像网站
3只是获取指示的文件
4镜像URL中的所有链接(多镜像)
5URL中的测试链接(书签测试)
0退出
Proxy (return=none) :
//是否使用代理,没有直接回车
You can define wildcards, like: -*.gif +www.*.com/*.zip -*img_*.zip
Wildcards (return=none) :
// 通配符下载,直接回车
You can define additional options, such as recurse level (-r<number>), separated by blank spaces
To see the option list, type help
Additional options (return=none) :
// 选项, 回车
Ready to launch the mirror? (Y/n) :
// Y 回车
...等待...
Mirror launched on Mon, 09 Sep 2019 23:05:03 by HTTrack Website Copier/3.49-2 [XR&CO'2014]
mirroring https://www.xxx.com with the wizard help..
Done.
Thanks for using HTTrack!
// 完成
网友评论