0

0

Linux下载文件命令wget的使用说明

P粉602998670

P粉602998670

发布时间:2025-09-07 11:51:02

|

814人浏览过

|

来源于php中文网

原创

wget是一个强大的命令行下载工具,支持断点续传、递归下载和镜像网站。使用wget -c可续传中断的大文件;--mirror --convert-links --page-requisites --no-parent可完整下载网站用于离线浏览;与curl相比,wget专注下载,而curl更擅长多协议交互和API调试。

linux下载文件命令wget的使用说明

wget
在Linux世界里,就像是命令行下的一个瑞士军刀,专门用来从网络上下载文件。它简单、直接,而且功能强大到足以处理各种复杂的下载任务,从单个文件到整个网站,它都能搞定。对我来说,它不仅仅是一个命令,更是一个在无数次自动化脚本和服务器维护中,帮我省下大量时间和精力的老伙计。它的核心价值在于,即使网络中断,它也能智能地尝试续传,而且完全不需要图形界面,这在远程服务器管理时简直是福音。

解决方案

使用

wget
下载文件,最基础的命令格式是:

wget [选项] [URL]

例如,要下载一个名为

example.zip
的文件,你只需要知道它的网络地址:

wget https://example.com/files/example.zip

文件会默认下载到当前目录。如果你想指定下载到其他目录,可以用

-P
--directory-prefix
选项:

wget -P /home/user/downloads https://example.com/files/example.zip

如果下载的文件名太长或者你想给它换个名字,

-O
--output-document
就派上用场了:

wget -O my_custom_name.zip https://example.com/files/example.zip

有时候,下载需要认证,比如通过用户名和密码,这时候

-user
--password
就很有用了:

wget --user=your_username --password=your_password https://example.com/secure/file.tar.gz

当然,很多时候我们下载的文件可能来自一个不是很稳定的网络,或者文件本身就很大。

wget
在这种情况下表现得非常出色,特别是它处理中断下载的能力,简直是救星。

Linux wget命令如何下载整个网站或目录?

说实话,

wget
真正让我觉得它不可替代的,是它递归下载的能力。这不仅仅是下载一个文件,而是可以抓取整个网站或者一个目录下的所有内容。这功能在做离线浏览、备份网站或者分析网站结构时特别有用。

要实现这个,你需要用到

--recursive
-r
选项。但仅仅这样还不够,通常我们还需要一些其他的选项来精细控制下载行为:

  • --level=N
    :指定递归的深度。默认是5,但如果你只想下载当前目录下的所有文件,可以设为1。
  • --no-parent
    :这个选项非常重要,它会阻止
    wget
    访问父目录,确保你不会意外地下载到网站根目录以外的东西。
  • --convert-links
    :下载完成后,将HTML文件中的链接转换为本地链接,这样你就可以在本地离线浏览整个网站了。
  • --page-requisites
    -P
    :下载所有页面所需的附加文件,比如图片、CSS文件、JavaScript脚本等,确保页面在本地能完整显示。
  • --mirror
    -m
    :这是一个组合选项,等同于
    -r -N -l inf --no-host-directories
    ,它会以镜像模式下载网站,保留时间戳,并无限递归。这是下载整个网站的最佳实践。

举个例子,如果你想完整地镜像一个网站供离线浏览:

wget --mirror --convert-links --page-requisites --no-parent https://example.com/

这个命令会下载

example.com
网站的所有内容,并调整链接,让你可以在本地浏览器中打开下载下来的HTML文件,就像在线浏览一样。不过,在使用这个功能时,务必注意目标网站的
robots.txt
文件,尊重网站的抓取策略,避免给对方服务器造成不必要的负担。

万华互连中英文企业网站系统2012
万华互连中英文企业网站系统2012

专业的企业网站管理系统,专为中小企业公司开发设计,能让企业轻松管理网站,强大的后台功能,可随意增减栏目,有多种企业常用的栏目模块功能。多级分类,管理文章,图片,文字编辑,留言管理,人才,软件下载等。可让企业会上网就会管理网站,轻松学会使用。 系统功能模块有:单页(如企业简介,联系内容等单页图文)、文章(新闻)列表、产品(图片、订单、规格说明等)、图片、下载、人才招聘、视频、机构组识、全国销售网点图

下载

wget下载大文件中断后如何续传?

这大概是

wget
最常用的功能之一了,尤其是在处理那些动辄几个GB的大文件时。网络环境不稳定、断电、或者只是你不小心关掉了终端,都可能导致下载中断。这时候,
wget
的续传功能简直是雪中送炭。

核心选项是

-c
--continue
。当一个下载任务中断后,你只需要用相同的
wget
命令,加上
-c
选项,
wget
就会检查本地已下载的部分,然后从上次中断的地方继续下载。

# 假设你正在下载一个大文件,但中断了
wget https://example.com/large_archive.tar.gz

# 几分钟后,你发现中断了,想继续下载
wget -c https://example.com/large_archive.tar.gz

它能做到这一点,是因为HTTP协议本身支持“范围请求”(Range Requests)。当

wget -c
执行时,它会告诉服务器,它已经有了文件的前N个字节,请求服务器从第N+1个字节开始发送数据。当然,前提是服务器也支持这个功能,不过现在绝大多数的HTTP服务器都支持。

我个人就经常遇到这种情况,尤其是在下载一些大型的虚拟机镜像或者数据集时。没有

-c
,可能每次中断都意味着从头再来,那简直是噩梦。所以,只要是下载大文件,我几乎都会习惯性地带上
-c
,以防万一。

wget与curl命令有哪些核心差异和适用场景?

在Linux命令行工具中,

wget
curl
都是下载文件或与Web服务器交互的利器,但它们的设计理念和主要用途却有些不同。在我看来,它们就像是工具箱里两把不同的锤子,各有各的用武之地。

wget
Web Getter)顾名思义,它的核心设计目标就是“获取”Web上的资源。它更专注于非交互式、递归式的下载。如果你需要下载一个文件、一个目录甚至整个网站,并且希望这个过程是自动化的、能在后台运行的,那么
wget
通常是首选。它的递归下载、续传、后台运行(通过
&
--background
)等功能,都体现了其作为下载工具的强大。

curl
Client URL)则更加通用,它是一个数据传输工具,支持的协议远不止HTTP/HTTPS,还包括FTP、FTPS、Gopher、SMB、Telnet等二十多种协议。
curl
的设计更侧重于与服务器进行“交互”,它可以发送自定义的HTTP请求头、处理各种认证、上传数据、甚至模拟浏览器行为。它更像是一个“瑞士军刀”,适合那些需要精细控制网络请求的场景,比如测试API接口、调试Web服务、或者进行数据抓取时。

核心差异总结:

  • 默认行为:
    wget
    默认下载文件到本地,而
    curl
    默认将内容输出到标准输出(终端)。
  • 递归下载:
    wget
    天生支持递归下载(
    -r
    ),而
    curl
    没有内置的递归下载功能,需要通过脚本实现。
  • 协议支持:
    wget
    主要支持HTTP、HTTPS和FTP,而
    curl
    支持的协议种类更多。
  • 上传:
    curl
    可以上传数据(
    -F
    -T
    ),
    wget
    则没有这个功能。
  • API测试:
    curl
    在API测试和调试方面更强大,可以轻松构造各种HTTP请求(GET, POST, PUT, DELETE等)。

适用场景:

  • 选择
    wget
    当你需要下载单个文件、批量下载、镜像网站、或者在脚本中进行非交互式下载时。
  • 选择
    curl
    当你需要测试API、上传文件、发送自定义HTTP请求、或者与各种不同协议的服务器进行交互时。

坦白说,在我的日常工作中,这两个命令经常是并存的。对于简单的文件下载或网站备份,我会毫不犹豫地使用

wget
。但如果我需要调试一个RESTful API,或者需要发送一个带有特定头部信息的POST请求,那么
curl
就是我的首选。它们各有侧重,互为补充,理解它们的差异能让你在面对不同的网络任务时,选择最合适的工具。

相关专题

更多
js获取数组长度的方法
js获取数组长度的方法

在js中,可以利用array对象的length属性来获取数组长度,该属性可设置或返回数组中元素的数目,只需要使用“array.length”语句即可返回表示数组对象的元素个数的数值,也就是长度值。php中文网还提供JavaScript数组的相关下载、相关课程等内容,供大家免费下载使用。

556

2023.06.20

js刷新当前页面
js刷新当前页面

js刷新当前页面的方法:1、reload方法,该方法强迫浏览器刷新当前页面,语法为“location.reload([bForceGet]) ”;2、replace方法,该方法通过指定URL替换当前缓存在历史里(客户端)的项目,因此当使用replace方法之后,不能通过“前进”和“后退”来访问已经被替换的URL,语法为“location.replace(URL) ”。php中文网为大家带来了js刷新当前页面的相关知识、以及相关文章等内容

374

2023.07.04

js四舍五入
js四舍五入

js四舍五入的方法:1、tofixed方法,可把 Number 四舍五入为指定小数位数的数字;2、round() 方法,可把一个数字舍入为最接近的整数。php中文网为大家带来了js四舍五入的相关知识、以及相关文章等内容

733

2023.07.04

js删除节点的方法
js删除节点的方法

js删除节点的方法有:1、removeChild()方法,用于从父节点中移除指定的子节点,它需要两个参数,第一个参数是要删除的子节点,第二个参数是父节点;2、parentNode.removeChild()方法,可以直接通过父节点调用来删除子节点;3、remove()方法,可以直接删除节点,而无需指定父节点;4、innerHTML属性,用于删除节点的内容。

477

2023.09.01

JavaScript转义字符
JavaScript转义字符

JavaScript中的转义字符是反斜杠和引号,可以在字符串中表示特殊字符或改变字符的含义。本专题为大家提供转义字符相关的文章、下载、课程内容,供大家免费下载体验。

414

2023.09.04

js生成随机数的方法
js生成随机数的方法

js生成随机数的方法有:1、使用random函数生成0-1之间的随机数;2、使用random函数和特定范围来生成随机整数;3、使用random函数和round函数生成0-99之间的随机整数;4、使用random函数和其他函数生成更复杂的随机数;5、使用random函数和其他函数生成范围内的随机小数;6、使用random函数和其他函数生成范围内的随机整数或小数。

1011

2023.09.04

如何启用JavaScript
如何启用JavaScript

JavaScript启用方法有内联脚本、内部脚本、外部脚本和异步加载。详细介绍:1、内联脚本是将JavaScript代码直接嵌入到HTML标签中;2、内部脚本是将JavaScript代码放置在HTML文件的`<script>`标签中;3、外部脚本是将JavaScript代码放置在一个独立的文件;4、外部脚本是将JavaScript代码放置在一个独立的文件。

658

2023.09.12

Js中Symbol类详解
Js中Symbol类详解

javascript中的Symbol数据类型是一种基本数据类型,用于表示独一无二的值。Symbol的特点:1、独一无二,每个Symbol值都是唯一的,不会与其他任何值相等;2、不可变性,Symbol值一旦创建,就不能修改或者重新赋值;3、隐藏性,Symbol值不会被隐式转换为其他类型;4、无法枚举,Symbol值作为对象的属性名时,默认是不可枚举的。

553

2023.09.20

PS使用蒙版相关教程
PS使用蒙版相关教程

本专题整合了ps使用蒙版相关教程,阅读专题下面的文章了解更多详细内容。

23

2026.01.19

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 7.4万人学习

Git 教程
Git 教程

共21课时 | 2.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号