|
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
对于linux命令,一定要学会用man和info去查他们的解释;
明天上彀查了一些关于wget这个壮大的收集工具的利用办法,现枚举以下:
wget利用技能集锦
wget的利用情势是:
wget[参数列表]URL
起首来先容一下wget的次要参数:
·-b:让wget在背景运转,纪录文件写在以后目次下"wget-log"文件中;
·-t[nuberoftimes]:实验次数,当wget没法与服务器创建毗连时,实验毗连几次。好比"-t120"暗示实验120次。当这一项为"0"的时分,指定实验无量屡次直到毗连乐成为止,这个设置十分有效,当对方服务器俄然关机大概收集俄然中止的时分,能够在恢复一般后持续下载没有传完的文件;
·-c:断点续传,这也是个十分有效的设置,出格当下载对照年夜的文件的时分,假如半途不测中止,那末毗连恢复的时分会从前次没传完的中央接着传,而不是又重新入手下手,利用这一项必要远程服务器也撑持断点续传,一样平常来说,基于UNIX/Linux的Web/FTP服务器都撑持断点续传;
·-T[numberofseconds]:超不时间,指定多长工夫远程服务器没有呼应就中止毗连,入手下手下一次实验。好比"-T120"暗示假如120秒今后远程服务器没有发过去数据,就从头实验毗连。假如收集速率对照快,这个工夫能够设置的短些,相反,能够设置的长一些,一样平常最多不凌驾900,一般也很多于60,一样平常设置在120摆布对照符合;
·-w[numberofseconds]:在两次实验之间守候几秒,好比"-w100"暗示两次实验之间守候100秒;
·-Yon/off:经由过程/欠亨过代办署理服务器举行毗连;默许是on
·-Q[byetes]:限定下载文件的总巨细最多不克不及凌驾几,好比"-Q2k"暗示不克不及凌驾2K字节,"-Q3m"暗示最多不克不及凌驾3M字节,假如数字前面甚么都不加,就暗示是以字节为单元,好比"-Q200"暗示最多不克不及凌驾200字节;
·-nd:不下载目次布局,把从服务器一切指定目次下载的文件都堆到以后目次里;
·-x:与"-nd"设置恰好相反,创立完全的目次布局,比方"wget-ndhttp://www.baidu.com"将创立在以后目次下创立"www.baidu.com"子目次,然后依照服务器实践的目次布局一级一级建下往,直到一切的文件都传完为止;
·-nH:不创立以方针主机域名为目次名的目次,将方针主机的目次布局间接下到以后目次下;
·--http-user=username
·--http-passwd=password:假如Web服务器必要指定用户名和口令,用这两项来设定;
·--proxy-user=username
·--proxy-passwd=password:假如代办署理服务器必要输出用户名和口令,利用这两个选项;
·-r:在本机创建服务器端目次布局;
·-l[depth]:下载远程服务器目次布局的深度,比方"-l5"下载目次深度小于大概即是5之内的目次布局大概文件;
·-m:做站点镜像时的选项,假如你想做一个站点的镜像,利用这个选项,它将主动设定其他符合的选项以便于站点镜像;
·-np:只下载方针站点指定目次及其子目次的内容。这也是一个十分有效的选项,我们假定某团体的团体主页内里有一个指向这个站点其别人团体主页的毗连,而我们只想下载这团体的团体主页,假如不设置这个选项,乃至--有大概把全部站点给抓上去,这明显是我们一般不但愿的;
II怎样设定wget所利用的代办署理服务器
wget可使用用户设置文件".wgetrc"来读取良多设置,我们这里次要使用这个文件来是设置代办署理服务器。利用者用甚么用户登录,那末甚么用户主目次下的".wgetrc"文件就起感化。比方,"root"用户假如想利用".wgetrc"来设置代办署理服务器,"/root/.wgert"就起感化,上面给出一个".wgetrc"文件的内容,能够参照这个例子来编写本人的"wgetrc"文件:
http-proxy=111.111.111.111:8080
ftp-proxy=111.111.111.111:8080
这两行的寄义是,代办署理服务器IP地点为:111.111.111.111,端标语为:80。第一行指定HTTP协定所利用的代办署理服务器,第二行指定FTP协定所利用的代办署理服务器。
get怎样利用黉舍的socks代办署理?
/usr/local/etc/wgetrc或~/.wgetrc:
http_proxy=202.119.24.35:8080
ftp_proxy=202.119.24.35:8080
proxy-user=user
proxy-passwd=password
use_proxy=on
参数:
代码:
$wget--help
GNUWget1.9.1,非交互式的收集文件下载工具。
用法:wget[选项]...[URL]...
长选项必需用的参数在利用短选项时也是必需的。
启动:
-V,--version显现Wget的版本而且加入。
-h,--help打印此匡助。
-b,-background启动落后进背景操纵。
-e,-execute=COMMAND运转‘.wgetrc’情势的命令。
日记纪录及输出文件:
-o,--output-file=文件将日记动静写进到指定文件中。
-a,--append-output=文件将日记动静追加到指定文件的末了。
-d,--debug打印调试输入。
-q,--quiet宁静形式(不输入信息)。
-v,--verbose具体输入形式(默许)。
-nv,--non-verbose封闭具体输入形式,但不进进宁静形式。
-i,--input-file=文件下载从指定文件中找到的URL。
-F,--force-html以HTML体例处置输出文件。
-B,--base=URL利用-F-i文件选项时,在绝对链接前增加指定的URL。
下载:
-t,--tries=次数设置重试次数(0暗示无穷)。
--retry-connrefused即便回绝毗连也重试。
-O--output-document=文件将数据写进此文件中。
-nc,--no-clobber不变动已存在的文件,也不利用在文件名后
增加.#(#为数字)的办法写进新的文件。
-c,--continue持续吸收已下载了一部分的文件。
--progress=体例选择下载进度的暗示体例。
-N,--timestamping除非远程文件较新,不然不再取回。
-S,--server-response显现服务器回应动静。
--spider不下载任何数据。
-T,--timeout=秒数设置读取数据的超不时间(秒数)。
-w,--wait=秒数吸收分歧文件之间守候的秒数。
--waitretry=秒数在每次重试之间稍等一段工夫(由1秒至指定的秒数不等)。
--random-wait吸收分歧文件之间稍等一段工夫(由0秒至2*WAIT秒不等)。
-Y,--proxy=on/off翻开或封闭代办署理服务器。
-Q,--quota=巨细设置吸收数据的限额巨细。
--bind-address=地点利用本机的指定地点(主机称号或IP)举行毗连。
--limit-rate=速度限定下载的速度。
--dns-cache=off克制查找存于高速缓存中的DNS。
--restrict-file-names=OS限定文件名中的字符为指定的OS(操纵体系)所同意的字符。
目次:
-nd--no-directories不创立目次。
-x,--force-directories强迫创立目次。
-nH,--no-host-directories不创立含有远程主机称号的目次。
-P,--directory-prefix=称号保留文件前先创立指命名称的目次。
--cut-dirs=数量疏忽远程目次中指定命目标目次层。
HTTP选项:
--http-user=用户设置http用户名。
--http-passwd=暗码设置http用户暗码。
-C,--cache=on/off(不)利用服务器中的高速缓存中的数据(默许是利用的)。
-E,--html-extension将一切MIME范例为text/html的文件都加上.html扩大文件名。
--ignore-length疏忽“Content-Length”文件头字段。
--header=字符串在文件头中增加指定字符串。
--proxy-user=用户设置代办署理服务器用户名。
--proxy-passwd=暗码设置代办署理服务器用户暗码。
--referer=URL在HTTP哀求中包括“Referer:URL”头。
-s,--save-headers将HTTP头存进文件。
-U,--user-agent=AGENT标记为AGENT而不是Wget/VERSION。
--no-http-keep-alive禁用HTTPkeep-alive(耐久性毗连)。
--cookies=off禁用cookie。
--load-cookies=文件会话入手下手前由指定文件载进cookie。
--save-cookies=文件会话停止后将cookie保留至指定文件。
--post-data=字符串利用POST办法,发送指定字符串。
--post-file=文件利用POST办法,发送指定文件中的内容。
HTTPS(SSL)选项:
--sslcertfile=文件可选的客户段端证书。
--sslcertkey=密钥文件对此证书可选的“密钥文件”。
--egd-file=文件EGDsocket文件名。
--sslcadir=目次CA散列表地点的目次。
--sslcafile=文件包括CA的文件。
--sslcerttype=0/1Client-Cert范例0=PEM(默许)/1=ASN1(DER)
--sslcheckcert=0/1依据供应的CA反省服务器的证书
--sslprotocol=0-3选择SSL协定;0=主动选择,
1=SSLv22=SSLv33=TLSv1
FTP选项:
-nr,--dont-remove-listing不删除“.listing”文件。
-g,--glob=on/off设置是不是睁开有通配符的文件名。
--passive-ftp利用“主动”传输形式。
--retr-symlinks在递回形式中,下载链接所唆使的文件(连至目次则破例)。
递回下载:
-r,--recursive递回下载。
-l,--level=数字最年夜递回深度(inf或0暗示无穷)。
--delete-after删除下载后的文件。
-k,--convert-links将相对链接转换为绝对链接。
-K,--backup-converted转换文件X前先将其备份为X.orig。
-m,--mirror等效于-r-N-linf-nr的选项。
-p,--page-requisites下载一切显现完全网页所需的文件,比方图象。
--strict-comments翻开对HTML备注的严厉(SGML)处置选项。
递回下载时有关承受/回绝的选项:
-A,--accept=列表承受的文件款式列表,以逗号分开。
-R,--reject=列表扫除的文件款式列表,以逗号分开。
-D,--domains=列表承受的域列表,以逗号分开。
--exclude-domains=列表扫除的域列表,以逗号分开。
--follow-ftp跟从HTML文件中的FTP链接。
--follow-tags=列表要跟从的HTML标志,以逗号分开。
-G,--ignore-tags=列表要疏忽的HTML标志,以逗号分开。
-H,--span-hosts递回时可进进别的主机。
-L,--relative只跟从绝对链接。
-I,--include-directories=列表要下载的目次列表。
-X,--exclude-directories=列表要扫除的目次列表。
-np,--no-parent不搜刮下层目次。
按照它们在系统中的作用分成几个部分介绍给大家,通过这些基础命令的学习我们可以进一步理解Linux系统: |
|