wget 命令相关,下载整个网站

wget -r -p -np -k https://www.varnish-cache.org/docs/4.0/

这个命令可以以递归的方式下载整站,并可以将下载的页面中的链接转换为本地链接。
wget加上参数之后,即可成为相当强大的下载工具。
熟练掌握wget命令,可以帮助你方便的使用linux。

用wget下载东西,的确很方便,它会自动重连并断点续传。让人很放心。
经常要下载一个网站或网站的某个目录。

将wget命令放到这里备用:
下载一个目录,例如网站的yourdir
wget -U "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; GTB5)" -r -p -k -np -Pmydir -nc -o down.log http://www.yourdomain.com/yourdir/index.html
如果要想下载整个网站,最好去除-np参数。
wget -U "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; GTB5)" -r -p -k -nc -o down.log http://www.yourdomain.com/index.html
-U   修改agent,伪装成IE货firefox等
-r,  --recursive(递归) specify recursive download.(指定递归下载)对于HTTP主机,wget首先下载URL指定的文件,然后(如果该文件是一个HTML文档的话)递归下载该文件所引用(超级连接)的所有文件(递 归深度由参数-l指定)。对FTP主机,该参数意味着要下载URL指定的目录中的所有文件,递归方法与HTTP主机类似。
-c    指定断点续传功能。实际上,wget默认具有断点续传功能,只有当你使用别的ftp工具下载了某一文件的一部分,并希望wget接着完成此工作的时候,才需要指定此参数。
-nc  不下载已经存在的文件 另外断点续传用-nc参数 日志用-o参数

-np, --no-parent(不追溯至父级)          don't ascend to the parent directory. 表示不跟随链接,只下载指定目录及子目录里的东西;

-p,  --page-requisites(页面必需元素)    get all images, etc. needed to display HTML page.(下载所有的图片等页面显示所需的内容)下载页面显示所需的所有文件。比如页面中包含了图片,但是图片并不在/yourdir目录中,而在/images目录下,有此参数,图片依然会被正常下载。

-k,  --convert-links(转换链接)      make links in downloaded HTML point to local files.(将下载的HTML页面中的链接转换为相对链接即本地链接) 修复下载文件中的绝对连接为相对连接,这样方便本地阅读。

posted @ 2018-03-07 14:27  屌丝的IT  阅读(310)  评论(0)    收藏  举报