0

0

如何用Node.js Stream处理大文件而不耗尽内存?

狼影

狼影

发布时间:2025-10-03 14:04:02

|

390人浏览过

|

来源于php中文网

原创

使用Node.js流可避免大文件内存溢出,通过fs.createReadStream分块读取,配合pipe实现高效数据传输与Transform流处理数据转换,确保低内存占用。

如何用node.js stream处理大文件而不耗尽内存?

处理大文件时,如果一次性将整个文件读入内存,很容易导致内存溢出。Node.js 的 Stream 模型正是为这类场景设计的——它允许你以“流”的方式逐块处理数据,从而避免内存压力。

使用可读流分块读取文件

通过 fs.createReadStream() 创建一个可读流,文件会被分成小块(chunks)逐步读取,而不是全部加载到内存中。

例如,读取一个 1GB 的日志文件:

const fs = require('fs');

const readStream = fs.createReadStream('large-file.log', { encoding: 'utf8', highWaterMark: 64 * 1024 // 每次读取 64KB });

readStream.on('data', (chunk) => { // 处理每个数据块,比如搜索关键词 console.log(Received chunk of ${chunk.length} characters); });

readStream.on('end', () => { console.log('文件读取完成'); });

readStream.on('error', (err) => { console.error('读取出错:', err); });

highWaterMark 控制每次读取的数据量,可根据系统资源调整,避免过小影响性能或过大占用内存。

通过管道(pipe)高效传输数据

最安全高效的方式是使用 pipe() 方法,它自动处理背压(backpressure),确保写入速度跟不上时暂停读取。

比如复制大文件:

const fs = require('fs');

const readStream = fs.createReadStream('source-big-file.zip'); const writeStream = fs.createWriteStream('copy-big-file.zip');

readStream.pipe(writeStream);

甲骨文AI协同平台
甲骨文AI协同平台

专门用于甲骨文研究的革命性平台

下载

writeStream.on('finish', () => { console.log('文件复制完成'); });

这种方式几乎不消耗额外内存,因为数据从源流直接“流入”目标流,中间不会堆积。

在流中进行转换处理

如果需要修改内容(如压缩、过滤、转码),可以插入一个 Transform 流。

例如,将文本转为大写并写入新文件:

const fs = require('fs');
const { Transform } = require('stream');

const upperCaseTransform = new Transform({ transform(chunk, encoding, callback) { callback(null, chunk.toString().toUpperCase()); } });

const readStream = fs.createReadStream('input.txt'); const writeStream = fs.createWriteStream('output.txt');

readStream.pipe(upperCaseTransform).pipe(writeStream);

Transform 流天然支持背压管理,确保处理节奏与数据流动匹配。

基本上就这些。用好可读流、可写流和 pipe,再结合 Transform 做中间处理,就能轻松应对 GB 级文件而不担心内存爆炸。关键是避免把整个文件塞进内存,始终以“流”的思维来设计数据流动。

相关专题

更多
堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

392

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

572

2023.08.10

js正则表达式
js正则表达式

php中文网为大家提供各种js正则表达式语法大全以及各种js正则表达式使用的方法,还有更多js正则表达式的相关文章、相关下载、相关课程,供大家免费下载体验。

510

2023.06.20

js获取当前时间
js获取当前时间

JS全称JavaScript,是一种具有函数优先的轻量级,解释型或即时编译型的编程语言;它是一种属于网络的高级脚本语言,主要用于Web,常用来为网页添加各式各样的动态功能。js怎么获取当前时间呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

244

2023.07.28

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

258

2023.08.03

js是什么意思
js是什么意思

JS是JavaScript的缩写,它是一种广泛应用于网页开发的脚本语言。JavaScript是一种解释性的、基于对象和事件驱动的编程语言,通常用于为网页增加交互性和动态性。它可以在网页上实现复杂的功能和效果,如表单验证、页面元素操作、动画效果、数据交互等。

5285

2023.08.17

js删除节点的方法
js删除节点的方法

js删除节点的方法有:1、removeChild()方法,用于从父节点中移除指定的子节点,它需要两个参数,第一个参数是要删除的子节点,第二个参数是父节点;2、parentNode.removeChild()方法,可以直接通过父节点调用来删除子节点;3、remove()方法,可以直接删除节点,而无需指定父节点;4、innerHTML属性,用于删除节点的内容。

477

2023.09.01

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

209

2023.09.04

Java JVM 原理与性能调优实战
Java JVM 原理与性能调优实战

本专题系统讲解 Java 虚拟机(JVM)的核心工作原理与性能调优方法,包括 JVM 内存结构、对象创建与回收流程、垃圾回收器(Serial、CMS、G1、ZGC)对比分析、常见内存泄漏与性能瓶颈排查,以及 JVM 参数调优与监控工具(jstat、jmap、jvisualvm)的实战使用。通过真实案例,帮助学习者掌握 Java 应用在生产环境中的性能分析与优化能力。

3

2026.01.20

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Node.js 教程
Node.js 教程

共57课时 | 9万人学习

【web前端】Node.js快速入门
【web前端】Node.js快速入门

共16课时 | 2万人学习

Node.js-前端工程化必学
Node.js-前端工程化必学

共19课时 | 3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号