美文网首页
如何利用WGET覆写已存在的档案

如何利用WGET覆写已存在的档案

作者: 骑着大象去上班 | 来源:发表于2019-06-07 21:01 被阅读0次

如果你有用wget下載檔案,而且檔名都是一樣的話,如設定排程每天自動下載antivir的病毒碼,那麼你會發現,wget不會覆寫原本已經存在的檔案。而在他的說明文件中,似乎也沒有辦法在下載前先刪除已存在的檔案,只有檢查遠端檔案是否比較新,若遠端檔案比較新才下載的參數。
而檢查檔案是否比較新的參數其實很簡單,只要輸入「-N」就可以了;而這裡還有一個更強的參數,叫做「-m」,這個參數是許多參數的結合,當然包括了「-N」,詳情就請看wget的說明文件囉!

所以,如果你要下載檔案的話,並且覆蓋掉原本的檔案,你可以用以下的兩個範例的其中之一,但前提是遠端檔案要比現在這個檔案還要新。
wget -N 網址
wget -m 網址 而如果要覆寫檔案,並將檔案存在指定目錄的話,如「/root」,那麼你可以用以下的指令:
wget -P /root -N 網址 在此,希望下一版的wget能推出真正覆寫檔案的功能囉!

例:

wget -P /usr/cs/steam/cstrike/addons/amxmodx/configs/ -N ftp://user:passwd@zzym.net/serdown/op/pub/users.ini

wget参数

-P 表示下载到哪个目录
-r 表示递归下载
-np 表示不下载旁站连接.
-k 表示将下载的网页里的链接修改为本地链接.
-p 获得所有显示网页所需的元素

额外的
-c 断点续传
-nd 递归下载时不创建一层一层的目录,把所有的文件下载到当前目录
-L 递归时不进入其它主机,如wget -c -r www.xxx.org/
-A 指定要下载的文件样式列表,多个样式用逗号分隔
-i 后面跟一个文件,文件内指明要下载的URL

代理可以在环境变量或wgetrc文件中设定

在环境变量中设定代理
export PROXY=http://211.90.168.94:8080/# 在~/.wgetrc中设定代理
http_proxy = http://proxy.yoyodyne.com:18023/
ftp_proxy = http://proxy.yoyodyne.com:18023/

wget各种选项分类列表

  • 启动

-V, –version 显示wget的版本后退出
-h, –help 打印语法帮助
-b, –background 启动后转入后台执行
-e, –execute=COMMAND
执行`.wgetrc’格式的命令,wgetrc格式参见/etc/wgetrc或~/.wgetrc

  • 记录和输入文件

-O, –output-file=FILE 把记录写到FILE文件中
-a, –append-output=FILE 把记录追加到FILE文件中
-d, –debug 打印调试输出
-q, –quiet 安静模式(没有输出)
-v, –verbose 冗长模式(这是缺省设置)
-nv, –non-verbose 关掉冗长模式,但不是安静模式
-i, –input-file=FILE 下载在FILE文件中出现的URLs
-F, –force-html 把输入文件当作HTML格式文件对待
-B, –base=URL 将URL作为在-F -i参数指定的文件中出现的相对链接的前缀
–sslcertfile=FILE 可选客户端证书
–sslcertkey=KEYFILE 可选客户端证书的KEYFILE
–egd-file=FILE 指定EGD socket的文件名

  • 下载

–bind-address=ADDRESS
指定本地使用地址(主机名或IP,当本地有多个IP或名字时使用)
-t, –tries=NUMBER 设定最大尝试链接次数(0 表示无限制).
-O –output-document=FILE 把文档写到FILE文件中
-nc, –no-clobber 不要覆盖存在的文件或使用.#前缀
-c, –continue 接着下载没下载完的文件
–progress=TYPE 设定进程条标记
-N, –timestamping 不要重新下载文件除非比本地文件新
-S, –server-response 打印服务器的回应
–spider 不下载任何东西
-T, –timeout=SECONDS 设定响应超时的秒数
-w, –wait=SECONDS 两次尝试之间间隔SECONDS秒
–waitretry=SECONDS 在重新链接之间等待1…SECONDS秒
–random-wait 在下载之间等待0…2*WAIT秒
-Y, –proxy=on/off 打开或关闭代理
-Q, –quota=NUMBER 设置下载的容量限制
–limit-rate=RATE 限定下载输率

  • 目录

-nd –no-directories 不创建目录
-x, –force-directories 强制创建目录
-nH, –no-host-directories 不创建主机目录
-P, –directory-prefix=PREFIX 将文件保存到目录 PREFIX/…
–cut-dirs=NUMBER 忽略 NUMBER层远程目录

  • HTTP 选项

–http-user=USER 设定HTTP用户名为 USER.
–http-passwd=PASS 设定http密码为 PASS.
-C, –cache=on/off 允许/不允许服务器端的数据缓存 (一般情况下允许).
-E, –html-extension 将所有text/html文档以.html扩展名保存
–ignore-length 忽略 Content-Length’头域 –header=STRING 在headers中插入字符串 STRING –proxy-user=USER 设定代理的用户名为 USER –proxy-passwd=PASS 设定代理的密码为 PASS –referer=URL 在HTTP请求中包含Referer: URL’头
-s, –save-headers 保存HTTP头到文件
-U, –user-agent=AGENT 设定代理的名称为 AGENT而不是 Wget/VERSION.
–no-http-keep-alive 关闭 HTTP活动链接 (永远链接).
–cookies=off 不使用 cookies.
–load-cookies=FILE 在开始会话前从文件 FILE中加载cookie
–save-cookies=FILE 在会话结束后将 cookies保存到 FILE文件中

  • FTP 选项

-nr, –dont-remove-listing 不移走 `.listing’文件
-g, –glob=on/off 打开或关闭文件名的 globbing机制
–passive-ftp 使用被动传输模式 (缺省值).
–active-ftp 使用主动传输模式
–retr-symlinks 在递归的时候,将链接指向文件(而不是目录)

  • 递归下载

-r, –recursive 递归下载--慎用!
-l, –level=NUMBER 最大递归深度 (inf 或 0 代表无穷).
–delete-after 在现在完毕后局部删除文件
-k, –convert-links 转换非相对链接为相对链接
-K, –backup-converted 在转换文件X之前,将之备份为 X.orig
-m, –mirror 等价于 -r -N -l inf -nr.
-p, –page-requisites 下载显示HTML文件的所有图片

  • 递归下载中的包含和不包含(accept/reject)

-A, –accept=LIST 分号分隔的被接受扩展名的列表
-R, –reject=LIST 分号分隔的不被接受的扩展名的列表
-D, –domains=LIST 分号分隔的被接受域的列表
–exclude-domains=LIST 分号分隔的不被接受的域的列表
–follow-ftp 跟踪HTML文档中的FTP链接
–follow-tags=LIST 分号分隔的被跟踪的HTML标签的列表
-G, –ignore-tags=LIST 分号分隔的被忽略的HTML标签的列表
-H, –span-hosts 当递归时转到外部主机
-L, –relative 仅仅跟踪相对链接
-I, –include-directories=LIST 允许目录的列表
-X, –exclude-directories=LIST 不被包含目录的列表
-np, –no-parent 不要追溯到父目录

相关文章

  • 如何利用WGET覆写已存在的档案

    如果你有用wget下載檔案,而且檔名都是一樣的話,如設定排程每天自動下載antivir的病毒碼,那麼你會發現,wg...

  • 高考志愿填报术语解读(1)档案类

    1.档案状态 如何通过判断档案状态来了解我们是否被录取呢? 首先来看档案的几种状态,档案的状态主要分为自由可投、已...

  • 档案信息化020 电子档案的存储载体

    电子档案的存储载体 电子档案一般以硬磁盘、磁带、光盘这三种介质备份。 为防止电子档案被修改,可利用一次写光盘只读的...

  • 如何利用客户档案!

    建立客户档案是销售的第一步工作,开发到一个好客户,如何确保自己对客户信息一清二楚?如何避免跟进“失踪”?……今天我...

  • wget(linux下的工具)打包下载网站

    wget 网址而要让档案自动储存到指令的目录下,则需要借用-P这个参数,可以使用以下的指令wget -P 目录 网...

  • 兰台速递 | 围绕中心,服务民生:枣庄市档案开发利用揭开新篇章

    档案利用服务工作是档案工作的出发点和落脚点,也是档案工作的灵魂和生命线。枣庄市档案局(馆)高度重视档案利用服务工作...

  • 档案是历史的见证――纪念6.9国际档案日

    为纪念国际档案日,谨将长期档案利用过程中撰写的利用实例,选择几例共享,意在增强公众档案意识、宣传档案工作价值,尽一...

  • 覆写

    概念:如果子类重写了父类:属性的覆盖与方法的覆写 方法的复写:子类定义了与父类方法名称,参数类型以及个数完全相同的...

  • 覆写

  • 覆写

    现在已经清楚了继承的基本概念,那么此时就有可能出现这样的一种情况,如果子类现在定义了与父类相同的方法或者是属性的时...

网友评论

      本文标题:如何利用WGET覆写已存在的档案

      本文链接:https://www.haomeiwen.com/subject/axvvxctx.html