如何快速克隆一个网站

作者: Dorm_Script | 来源:发表于2016-09-20 18:15 被阅读11000次

    今天来说一个实用的工具:网站克隆。这样的功能对于技术人员来说,不算什么大的功能,大家可以用N种办法来实现,各有各的奇技淫巧。今天主要介绍的是A哥的克隆工具curlMulti。借用这个功能,非技术人员也可以快速的克隆整个站点。

    工具链接:

    github

    工具特点:

    • 抓取网站的各项资源html\Css\Js\RAR压缩文件等
    • 并行抓取,抓取速度快的惊人

    傻瓜式操作流程

    Mac演示,mac自带了php,所以整体操作非常简单

    1:下载工具 - v2.3.3

    下载v2.3.3版本

    2:准备工作

    打开文件

    修改两行代码:


    Paste_Image.png

    正常情况,改网址就ok。如果需要克隆的站很大很大,需要在第一行加代码:

    ini_set('memory_limit', '2048M');

    3:执行克隆

    打开终端

    打开终端1
    打开终端2

    在终端执行如下操作:

    • 右键site_clone1.php文件,”显示简介“,如图选中文本, 复制(Ctrl+c)
    找到路径
    • 在终端输入: "cd ",然后Ctrl+v粘贴刚才复制的内容,回车 (输入字符不带双引号)

      我的终端是这样的,可以做为参考:

    Paste_Image.png
    • 在终端输入:

    php site_clone1.php

    到这里,克隆已经开始了。谨记,终端窗口不要关闭。(如果想让关闭窗口后继续克隆,请联系我)

    如果要克隆的网站比较小,如小说站,半小时就可以搞定(每秒克隆100+页面毫无压力)

    网站存放目录

    网站目录

    双击index.html就可以打开已经克隆下来的网站。

    附:如果想要更快的克隆,如下操作:

    修改并发数

    可以自己感受一下改成500的效果,估计局域网中正在打游戏的同学就要开骂了,哈哈!好吧,我估计不会有人想测试500并发的效果,因为局域网真会卡死。但是呢,如果真要测试500并发,那需要在终端多执行一行命令:

    ulimit -n 1000

    相关文章

      网友评论

      • 200269524d56:楼主加下QQ:593897983
      • 编号110:你这是整站下载,wget本身就有这个功能。
        fc09252b4bd9:楼主能加下我的QQ吗?
        251904925
        Dorm_Script:wget 确实很棒
        但wget克隆整站有几个缺点:
        1:单进程处理,会慢一些
        2:wget由系统提供,能处理常规需求。但针对特定需求,需要修改执行逻辑时比较费劲。
        附:现在的网站都已经相当复杂,js之间的相互引用,资源域名,相对、绝对地址格式等都与之前的网站有所不同,简单的wget很难适应现在的需求。


      • 7b67eb22f322:qq 1265372513
        Dorm_Script:加过了
      • 7b67eb22f322:楼主,能加qq吗?
      • AlicFeng:wget一天命令搞定(^3^)
        AlicFeng: @Dorm_Script 首先你这个只是访问服务器获取到的源码,并不是服务器部署的源码。有这种想法不错噢!nice
        Dorm_Script:wget应该是单进程下载的,慢
      • ff25daa9f985:你好,我抓取下来,没有图片资源?请问还需要设置什么吗?
        Dorm_Script:确认一下抓取的网站是不是做了图片防盗链
      • justZero:一篇文章里推荐一款win下的可视化工具:teleport ultra,也是这个功能,不过自己还没有尝试过~
        http://www.tenmax.com/teleport/ultra/home.htm
        justZero:@一千年以后_3d1c 后台不行,这个软件只是把网站每个页面抓下来,节省人力。网站后台对外不暴露,是抓不下来的
        a1423baaf850:这个能克隆后台吗? 我的QQ 173292188
      • 叮宕:linux 自带的wget 直接镜像网站也不错,只是是单线程的,确实会慢。
      • 28615fddf37d:楼主,我试过,没用……
        Dorm_Script: @alouha 这种页面基本全靠js加载出来的。用这个工具还真搞不成
        28615fddf37d:@Dorm_Script 我去爬一个后台模板,http://wrapbootstrap.com/preview/WB00J6977
        然后就爬了一个空文件夹
        Dorm_Script: @alouha 怎么可能,我还找了两个做运营的测试了一下。你那里遇到什么问题(O_O)?
      • 陈吉思涵:我明天试一下。
      • 惊鸿独舞:支持友友👍☕
      • 惊鸿独舞:好精彩👍
      • Dorm_Script:亲测,代码还需要优化,通用性还不够强

      本文标题:如何快速克隆一个网站

      本文链接:https://www.haomeiwen.com/subject/pjeoettx.html