Linux中的Wget命令及其示例
Wget是一个用于从网络下载文件的命令行实用程序。使用Wget,您可以使用HTTP、HTTPS和FTP协议下载文件。Wget提供了许多选项,允许您下载多个文件、恢复下载、限制带宽、递归下载、后台下载、镜像网站等等。本文通过实际示例和对最常见选项的详细解释,展示了如何使用wget命令。
- 安装Wget
目前,wget软件包已预装在大多数Linux发行版上。要检查系统上是否安装了wget软件包,请打开控制台,键入wget,然后按enter键。如果安装了wget,系统将打印wget:wget: missing URL。否则,它将打印未找到的wget命令。如果没有安装wget,您可以使用发行版的软件包管理器轻松安装它。
在Ubuntu和Debian上安装Wget:
sudo apt install wget
在CentOS和Fedora上安装Wget:
sudo yum install wget
- Wget命令语法
在介绍如何使用wget命令之前,让我们先回顾一下基本语法。wget实用程序表达式采用以下形式:
wget [options] [url]
options - Wget选项
url - 要下载或同步的文件或目录的URL。
- 如何使用wget下载文件
在最简单的形式中,当在没有任何选项的情况下使用时,wget会将[url]中指定的资源下载到当前目录。在以下示例中,我们正在下载Linux内核tar归档文件:
wget https://cdn.kernel.org/pub/linux/kernel/v4.x/linux-4.17.2.tar.xz
从上图中可以看到,wget首先解析域的IP地址,然后连接到远程服务器并开始传输。在下载过程中,wget会显示进度条以及文件名、文件大小、下载速度和完成下载的估计时间。下载完成后,您可以在当前工作目录中找到下载的文件。
要关闭输出,请使用-q选项。如果文件已经存在,wget将在文件名的末尾添加.N(数字)。
- 以不同名称保存下载的文件
要将下载的文件保存为其他名称,请传递-O选项,后跟所选名称:
wget -O latest-hugo.zip https://github.com/gohugoio/hugo/archive/master.zip
上面的命令会将GitHub中最新的hugo zip文件保存为latest-hugo.zip,而不是其原始名称。
- 将文件下载到特定目录
默认情况下,wget会将下载的文件保存在当前工作目录中。要将文件保存到特定位置,请使用-P选项:
wget -P /mnt/iso http://mirrors.mit.edu/centos/7/isos/x86_64/CentOS-7-x86_64-Minimal-1804.iso
上面的命令告诉wget将CentOS 7 iso文件保存到/mnt/iso目录。
- 限制下载速度
要限制下载速度,请使用--limit rate选项。默认情况下,速度以字节/秒为单位。附加k表示千字节,附加m表示兆字节,附加g表示千兆字节。以下命令将下载Go二进制文件,并将下载速度限制在1MB:
wget --limit-rate=1m https://dl.google.com/go/go1.10.3.linux-amd64.tar.gz
当您不希望wget消耗所有可用带宽时,此选项非常有用。
- 继续下载
您可以使用-c选项继续下载。如果在下载大文件的过程中连接中断,并且您可以继续上一次下载,而不是从头开始下载,这将非常有用。在以下示例中,我们将恢复Ubuntu 18.04 iso文件的下载:
wget -c http://releases.ubuntu.com/18.04/ubuntu-18.04-live-server-amd64.iso
如果远程服务器不支持恢复下载,wget将从头开始下载并覆盖现有文件。
- 后台下载
要在后台下载,请使用-b选项。在以下示例中,我们正在后台下载OpenSuse iso文件:
wget -b https://download.opensuse.org/tumbleweed/iso/openSUSE-Tumbleweed-DVD-x86_64-Current.iso
默认情况下,输出会重定向到当前目录中的wget日志文件。要查看下载的状态,请使用tail命令:
tail -f wget-log
- 更改Wget用户代理
有时在下载文件时,远程服务器可能会被设置为阻止Wget用户代理。在这种情况下,要模拟不同的浏览器,请传递-U选项。
wget --user-agent="Mozilla/5.0 (X11; Linux x86_64; rv:60.0) Gecko/20100101 Firefox/60.0" http://wget-forbidden.com/
上面的命令将模拟Firefox 60从wget-forbidden.com请求页面
- 下载多个文件
如果您想同时下载多个文件,请使用-i选项,后跟本地或外部文件的路径,该文件包含要下载的URL列表。每个URL都需要在一个单独的行上。以下示例显示了如何使用Linux-distros.txt文件中指定的URL下载Arch Linux、Debian和Fedora iso文件:
wget -i linux-distros.txt
http://mirrors.edge.kernel.org/archlinux/iso/2018.06.01/archlinux-2018.06.01-x86_64.iso
https://cdimage.debian.org/debian-cd/current/amd64/iso-cd/debian-9.4.0-amd64-netinst.iso
https://download.fedoraproject.org/pub/fedora/linux/releases/28/Server/x86_64/iso/Fedora-Server-dvd-x86_64-28-1.1.iso
如果指定-作为文件名,则URL将从标准输入中读取。
- 通过FTP下载
要从受密码保护的FTP服务器下载文件,请指定用户名和密码,如下所示:
wget --ftp-user=FTP_USERNAME --ftp-password=FTP_PASSWORD ftp://ftp.example.com/filename.tar.gz
- 创建网站镜像
要使用wget创建网站的镜像,请使用-m选项。这将通过关注和下载所有内部链接以及网站资源(JavaScript、CSS、Images)来创建网站的完整本地副本。
wget -m https://example.com
如果你想使用下载的网站进行本地浏览,你需要向上面的命令传递一些额外的参数。
wget -m -k -p https://example.com
-k选项将使wget转换下载文档中的链接,使其适合本地查看。-p选项将告诉wget下载显示HTML页面所需的所有文件。
- 正在跳过证书检查
如果要通过HTTPS从具有无效SSL证书的主机下载文件,请使用--no check certificate选项:
wget --no-check-certificate https://domain-with-invalid-ss.com
- 下载到标准输出
在下面的例子中,wget将悄悄地(flag-q)下载并输出最新的WordPress版本到stdout(flag-O-),并将其传输到tar实用程序,后者将把存档提取到/var/www目录。
wget -q -O - "http://wordpress.org/latest.tar.gz" | tar -xzf - -C /var/www
浙公网安备 33010602011771号