C++如何实现大文件的快速读取_C++利用内存映射文件mmap技术【性能】

冰火之心

发布时间：2026-02-05 15:18:10

664人浏览过

来源于php中文网

原创

mmap比fread更快读大文件，因其将文件直接映射为进程虚拟内存，读取即内存访问，省去内核/用户态拷贝与系统调用开销，尤其利于随机读、重复读和多线程并发读。

c++如何实现大文件的快速读取_c++利用内存映射文件mmap技术【性能】

为什么 mmap 比 fread 更快读大文件

mmap 不走传统 I/O 缓冲路径，它把文件直接映射成进程虚拟内存的一段，后续读取就是普通的内存访问（mov 指令级别），省去了内核态/用户态多次拷贝、系统调用开销。尤其对随机读、重复读、多线程并发读大文件，优势明显。但注意：它不减少磁盘 IO 本身，只是优化了数据搬运路径。

常见误判点：mmap 并非“一定更快”——小文件（

Linux 下 mmap 读取大文件的最小可靠写法

核心是正确处理 mmap 返回地址、长度对齐、以及 MAP_PRIVATE / MAP_SHARED 的选择。对只读场景，优先用 MAP_PRIVATE，避免写时复制（COW）干扰。

open() 必须带 O_RDONLY，且检查返回值是否为 -1
lseek() 或 fstat() 获取真实文件大小，不能依赖 stat.st_size 未刷新的情况
mmap() 的 length 参数必须 ≤ 文件大小；若传入 > 文件大小，映射区域末尾读取会触发 SIGBUS
映射后记得 munmap()，否则泄漏虚拟内存（虽不占物理内存，但耗 vm.max_map_count）

示例关键片段：

立即学习“C++免费学习笔记（深入）”；

塔猫ChatPPT

塔猫官网提供AI一键生成 PPT的智能工具，帮助您快速制作出专业的PPT。塔猫ChatPPT让您的PPT制作更加简单高效。

下载

int fd = open("large.bin", O_RDONLY);
struct stat sb;
fstat(fd, &sb);
void* addr = mmap(nullptr, sb.st_size, PROT_READ, MAP_PRIVATE, fd, 0);
if (addr == MAP_FAILED) { /* handle error */ }
// 使用 addr 作为 char* 直接读取
munmap(addr, sb.st_size);
close(fd);

mmap 在 Windows 上怎么对应实现

Windows 没有 mmap，但等效机制是 CreateFileMapping() + MapViewOfFile()。行为逻辑一致，但细节差异多：

必须先用 CreateFile() 打开文件，且 dwDesiredAccess 要匹配映射保护标志（如只读映射需 GENERIC_READ）
CreateFileMapping() 的 flProtect 用 PAGE_READONLY，而非 PROT_READ
MapViewOfFile() 返回的是 LPCVOID，类型安全起见建议 static_cast 转换
关闭顺序固定：先 UnmapViewOfFile()，再 CloseHandle() 映射句柄和文件句柄

跨平台封装时，别试图宏定义统一接口——二者错误码、生命周期、权限模型差异太大，容易埋坑。

容易被忽略的性能陷阱和调试信号

真正影响 mmap 实际性能的，往往不是映射本身，而是使用方式：

频繁跨页访问（如每次只读 1 字节且地址不连续）会引发大量缺页中断，比 fread 更慢
未对齐访问（如 int* 强转到非 4 字节对齐地址）在某些 CPU 架构上会崩溃或严重降速
strace 下看不到 read() 系统调用，但能看到 mmap 和大量 gettimeofday（因缺页统计），这是正常现象
用 /proc/[pid]/maps 可确认映射是否成功、是否被 split 或 merge，避免误判“没映射上”

调试 SIGBUS 错误，90% 是因为读越界（超过 st_size）或文件被其他进程截断——务必检查文件是否被动态修改。

C++ 怎么获取当前时间 C++ ctime库与格式化输出代码【日期】

Dev-C++怎么调试代码 C++断点调试详细步骤演示【实战】

C++ 怎么判断操作系统 C++ 预定义宏检测Windows或Linux【跨平台】

C++怎么获取屏幕分辨率 C++调用Windows API获取屏幕尺寸【系统】

c++如何进行socket网络编程_c++ socket tcp通信示例【教程】

数码产品性能查询

该软件包括了市面上所有手机CPU，手机跑分情况，电脑CPU，电脑产品信息等等，方便需要大家查阅数码产品最新情况，了解产品特性，能够进行对比选择最具性价比的商品。

下载

相关标签:

windows app 字节 access 虚拟内存 ai c++ win 为什么 red 架构封装 const int 接口线程多线程并发 windows

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：C++如何实现字符串替换所有子串_C++循环查找并替换文本方法【搜索】下一篇：C++如何判断文件是否存在_C++检查文件路径有效性多种方法【常识】

作者最新文章

Excel智能填充怎么用 Excel Ctrl+E快捷键神操作【快捷键】

2026-02-04 09:03

vivo手机怎么设置应用权限_vivo手机软件隐私管理教程【妙招】

2026-02-04 09:28

电脑文件夹打开很慢一直在绿条搜索怎么办_文件夹属性优化教程

2026-02-04 09:47

OPPO云服务怎么修改绑定的手机号_账号安全中心更换号码【步骤】

2026-02-04 09:47

Windows更新卡在0%或99% 怎么强制跳过或修复【终极方案】

2026-02-04 09:49

电脑时间总是自动跳回错误日期 CMOS电池更换指南【硬件常识】

2026-02-04 09:50

微博怎么发布长图文章_微博长图博文发布方法【实操】

2026-02-04 09:52

PS怎么切图_PS网页UI切图技巧【实操】

2026-02-04 10:04

今日头条app如何查看已点赞内容_今日头条app点赞记录位置【详解】

2026-02-04 10:06

文件夹删不掉_提示文件夹正在被另一程序占用【强制删除】

2026-02-04 10:17

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

c语言const用法

const是关键字，可以用于声明常量、函数参数中的const修饰符、const修饰函数返回值、const修饰指针。详细介绍：1、声明常量，const关键字可用于声明常量，常量的值在程序运行期间不可修改，常量可以是基本数据类型，如整数、浮点数、字符等，也可是自定义的数据类型；2、函数参数中的const修饰符，const关键字可用于函数的参数中，表示该参数在函数内部不可修改等等。

536

2023.09.20

string转int

在编程中，我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算，或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

585

2023.08.02

int占多少字节

int占4个字节，意味着一个int变量可以存储范围在-2,147,483,648到2,147,483,647之间的整数值，在某些情况下也可能是2个字节或8个字节，int是一种常用的数据类型，用于表示整数，需要根据具体情况选择合适的数据类型，以确保程序的正确性和性能。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

549

2024.08.29

c++怎么把double转成int

本专题整合了 c++ double相关教程，阅读专题下面的文章了解更多详细内容。

153

2025.08.29

C++中int的含义

本专题整合了C++中int相关内容，阅读专题下面的文章了解更多详细内容。

204

2025.08.29

硬盘接口类型介绍

硬盘接口类型有IDE、SATA、SCSI、Fibre Channel、USB、eSATA、mSATA、PCIe等等。详细介绍：1、IDE接口是一种并行接口，主要用于连接硬盘和光驱等设备，它主要有两种类型：ATA和ATAPI，IDE接口已经逐渐被SATA接口；2、SATA接口是一种串行接口，相较于IDE接口，它具有更高的传输速度、更低的功耗和更小的体积；3、SCSI接口等等。

1258

2023.10.19