如何用Node.js Stream处理大文件而不耗尽内存？

狼影

发布时间：2025-10-03 14:04:02

390人浏览过

来源于php中文网

原创

使用Node.js流可避免大文件内存溢出，通过fs.createReadStream分块读取，配合pipe实现高效数据传输与Transform流处理数据转换，确保低内存占用。

如何用node.js stream处理大文件而不耗尽内存？

处理大文件时，如果一次性将整个文件读入内存，很容易导致内存溢出。Node.js 的 Stream 模型正是为这类场景设计的——它允许你以“流”的方式逐块处理数据，从而避免内存压力。

使用可读流分块读取文件

通过 fs.createReadStream() 创建一个可读流，文件会被分成小块（chunks）逐步读取，而不是全部加载到内存中。

例如，读取一个 1GB 的日志文件：

const fs = require('fs');
<p>const readStream = fs.createReadStream('large-file.log', {
encoding: 'utf8',
highWaterMark: 64 * 1024 // 每次读取 64KB
});</p><p>readStream.on('data', (chunk) => {
// 处理每个数据块，比如搜索关键词
console.log(<code>Received chunk of ${chunk.length} characters</code>);
});</p><p>readStream.on('end', () => {
console.log('文件读取完成');
});</p><p>readStream.on('error', (err) => {
console.error('读取出错:', err);
});</p>

highWaterMark 控制每次读取的数据量，可根据系统资源调整，避免过小影响性能或过大占用内存。

通过管道（pipe）高效传输数据

最安全高效的方式是使用 pipe() 方法，它自动处理背压（backpressure），确保写入速度跟不上时暂停读取。

比如复制大文件：

const fs = require('fs');
<p>const readStream = fs.createReadStream('source-big-file.zip');
const writeStream = fs.createWriteStream('copy-big-file.zip');</p><p>readStream.pipe(writeStream);</p><div class="aritcle_card flexRow">
                                                        <div class="artcardd flexRow">
                                                                <a class="aritcle_card_img" href="/ai/992" title="阿里妈妈·创意中心"><img
                                                                                src="https://img.php.cn/upload/ai_manual/000/000/000/175680267675436.jpg" alt="阿里妈妈·创意中心"  onerror="this.onerror='';this.src='/static/lhimages/moren/morentu.png'" ></a>
                                                                <div class="aritcle_card_info flexColumn">
                                                                        <a href="/ai/992" title="阿里妈妈·创意中心">阿里妈妈·创意中心</a>
                                                                        <p>阿里妈妈营销创意中心</p>
                                                                </div>
                                                                <a href="/ai/992" title="阿里妈妈·创意中心" class="aritcle_card_btn flexRow flexcenter"><b></b><span>下载</span> </a>
                                                        </div>
                                                </div><p>writeStream.on('finish', () => {
console.log('文件复制完成');
});</p>

这种方式几乎不消耗额外内存，因为数据从源流直接“流入”目标流，中间不会堆积。

在流中进行转换处理

如果需要修改内容（如压缩、过滤、转码），可以插入一个 Transform 流。

例如，将文本转为大写并写入新文件：

const fs = require('fs');
const { Transform } = require('stream');
<p>const upperCaseTransform = new Transform({
transform(chunk, encoding, callback) {
callback(null, chunk.toString().toUpperCase());
}
});</p><p>const readStream = fs.createReadStream('input.txt');
const writeStream = fs.createWriteStream('output.txt');</p><p>readStream.pipe(upperCaseTransform).pipe(writeStream);</p>

Transform 流天然支持背压管理，确保处理节奏与数据流动匹配。

基本上就这些。用好可读流、可写流和 pipe，再结合 Transform 做中间处理，就能轻松应对 GB 级文件而不担心内存爆炸。关键是避免把整个文件塞进内存，始终以“流”的思维来设计数据流动。

如何在 Node.js 中为 MongoDB 查询结果动态添加属性与值

JavaScript脚本文件的字符编码UTF8配置注意事项

JavaScript安装与配置VSCode开发环境的进阶指南

JavaScript第一个HelloWorld程序的编写与执行流程

JavaScript全局对象window与globalThis的兼容性处理

相关标签:

node.js js node stream 内存占用堆 JS transform

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：JavaScript前端表单验证：正确使用逻辑运算符实现电子邮件格式检查下一篇：JavaScript中的标签模板函数有哪些高级应用场景？

作者最新文章

肉类年货批发进货渠道肉类年货在哪里批发

2026-03-07 04:05

小黑盒官网唯一地址_小黑盒游戏平台官网直达

2026-03-08 10:28

键盘快捷键失效怎么办_键盘快捷键设置恢复

2026-03-08 12:36

冬季空调温度多少度最适合老人小孩_冬天敏感人群空调温度设置

2026-03-10 00:27

小遛共享城市入口_小遛电单车已开通服务城市列表查询

2026-03-10 04:27

海鲜冻货年货批发市场海鲜类年货在哪批发

2026-03-10 10:33

什么样的走路姿势最省力每天走多少步最合适

2026-03-11 09:36

2026春节放假安排最新通知 2026年春节放假调休时间表

2026-03-12 08:29

B站如何查看历史记录_B站观看历史查找方式

2026-03-12 11:02

春运抢票新变化_2026年12306便民功能与服务升级

2026-03-13 10:27

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

堆和栈的区别

堆和栈的区别：1、内存分配方式不同；2、大小不同；3、数据访问方式不同；4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容，供大家免费下载体验。

448

2023.07.18

堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

606

2023.08.10

js正则表达式

php中文网为大家提供各种js正则表达式语法大全以及各种js正则表达式使用的方法，还有更多js正则表达式的相关文章、相关下载、相关课程，供大家免费下载体验。

531

2023.06.20

js获取当前时间

JS全称JavaScript，是一种具有函数优先的轻量级，解释型或即时编译型的编程语言;它是一种属于网络的高级脚本语言，主要用于Web，常用来为网页添加各式各样的动态功能。js怎么获取当前时间呢？php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

576

2023.07.28

js 字符串转数组

js字符串转数组的方法：1、使用“split()”方法；2、使用“Array.from()”方法；3、使用for循环遍历；4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容，供大家免费下载体验。

761

2023.08.03

js是什么意思

JS是JavaScript的缩写，它是一种广泛应用于网页开发的脚本语言。JavaScript是一种解释性的、基于对象和事件驱动的编程语言，通常用于为网页增加交互性和动态性。它可以在网页上实现复杂的功能和效果，如表单验证、页面元素操作、动画效果、数据交互等。

6331

2023.08.17

js删除节点的方法

js删除节点的方法有：1、removeChild()方法，用于从父节点中移除指定的子节点，它需要两个参数，第一个参数是要删除的子节点，第二个参数是父节点；2、parentNode.removeChild()方法，可以直接通过父节点调用来删除子节点；3、remove()方法，可以直接删除节点，而无需指定父节点；4、innerHTML属性，用于删除节点的内容。

494

2023.09.01