本篇文章是《每日一Linux命令》系列之六十一,主要介绍wget命令的使用方法及参数解析,帮助读者掌握高效下载和网络资源管理技巧。
`wget` 是 Linux 系统中的一个强大命令行下载工具,支持 HTTP、HTTPS 和 FTP 协议,并且可以通过 HTTP 代理进行下载。它的一大特点是后台执行和断点续传功能:用户可以启动下载任务后退出系统,而 `wget` 在后台继续工作直到完成;如果网络连接中断,可以在恢复连接时从断点处重新开始下载,这极大地提高了下载的便利性和成功率。
`wget` 的命令格式为 `wget [参数] [URL地址]`。其中 URL 地址是你想要下载资源的网络地址,而参数用于定制下载行为。例如:
- `-V, –version`:显示 wget 的版本信息。
- `-h, –help`:提供命令帮助信息。
- `-b, –background`:在后台运行 wget。
- `-e, –execute=COMMAND`:执行 `.wgetrc` 格式的命令。
- `-o, –output-file=FILE`:将下载日志写入指定文件。
- `-a, –append-output=FILE`:追加日志到指定的文件中。
- `-d, –debug`:开启调试输出。
- `-q, –quiet`:关闭所有输出,进入安静模式。
- `-v, –verbose`:开启详细输出(默认)。
- `-nv, –non-verbose`:关闭详细输出但不是安静模式。
- `-i, –input-file=FILE`:从指定的文件中读取 URL 列表进行批量下载。
- `-F, –force-html`:将输入文件视为 HTML 格式,以便解析链接。
- `-B, –base=URL`:设置 HTML 文件中的相对链接的基础 URL。
- `--sslcertfile=FILE`:指定客户端 SSL 证书文件。
- `--sslcertkey=KEYFILE`:指定客户端 SSL 证书的密钥文件。
- `–egd-file=FILE`:设置 EGD 套接字文件路径以提高随机数生成速度。
下载参数包括:
- `--bind-address=ADDRESS`:指定本地使用的 IP 地址或主机名。
- `-t, –tries=NUMBER`:设置最大重试链接次数。
- `-O, –output-document=FILE`:将下载的文件保存到指定的文件中。
- `-nc, –no-clobber`:如果目标文件已存在,不覆盖它。
- `-c, –continue`:如果已经部分下载,则从断点继续下载。
- `--progress=TYPE`:选择进度条样式。
- `-N, –timestamping`:只下载比本地文件新的文件。
- `-S, –server-response`:显示服务器的响应信息。
- `–spider`:仅进行爬网,不实际下载内容。
- `-T, –timeout=SECONDS`:设置超时时间。
- `-w, –wait=SECONDS`:两次尝试之间等待的时间间隔。
- `--waitretry=SECONDS`:在重新尝试下载之前等待的秒数。
- `–random-wait`:基于 `-w` 参数增加随机等待时间,以减少对服务器的压力。
这些特性使 `wget` 成为 Linux 系统中不可或缺的工具。无论是单个文件还是整个网站的镜像,甚至是需要断点续传的大文件,`wget` 都能高效地完成任务,在处理网络不稳定或带宽有限的情况下尤为突出。