0

0

C++如何实现位图(Bitmap)数据结构?(内存高效存储)

穿越時空

穿越時空

发布时间:2026-02-27 13:12:11

|

120人浏览过

|

来源于php中文网

原创

std::vector 不适合作为位图,因其是特化陷阱:不满足容器要求、迭代器非指针、对齐与访问行为实现相关;高并发或内存敏感场景下易引发调试困难和缓存失效。

c++如何实现位图(bitmap)数据结构?(内存高效存储)

为什么不用 std::vector<bool></bool> 做位图

std::vector<bool></bool> 确实是标准库提供的位级存储,但它是个特化陷阱:不满足容器要求(比如没有 data() 成员),迭代器不是指针,且对齐和访问行为因实现而异。实际做内存敏感场景(如亿级布尔标记)时,它反而增加调试成本和不可预测的 cache miss。

真正可控的位图,得自己管三件事:内存分配粒度、位索引到字节+偏移的映射、原子性写入边界。

  • std::vector<uint64_t></uint64_t>std::vector<char></char> 更友好——64 位一次读写,减少循环次数
  • 位索引 i 对应的字节位置是 i / 8,但用 i >> 6(除以 64)配合 uint64_t 才对齐
  • 设置第 i 位:先算桶号 idx = i >> 6,再算位掩码 mask = uint64_t{1}

如何安全支持并发设置(无锁但线程安全)

纯位图本身不自带同步,但多数场景只需要「多个线程可同时 set,读操作不阻塞」。这时别急着上 std::atomic<uint64_t></uint64_t> 数组——它在 x86 上虽能保证单条 or 指令原子,但 C++ 标准不保证 fetch_or 对任意位掩码的 lock-free 性,尤其在 ARM 或老编译器上可能退化为锁。

更稳的做法:用 std::atomic<uint64_t></uint64_t> 存储每个桶,set 时用 fetch_or(mask, std::memory_order_relaxed)。relaxed 足够,因为位图通常只表达“是否被标记过”,不要求顺序一致性。

立即学习C++免费学习笔记(深入)”;

XYZ SCIENCE
XYZ SCIENCE

免费论文AIGC检测,一键改写降AI率

下载
  • 初始化时用 std::vector<:atomic>>(n_buckets, 0)</:atomic>,别用聚合初始化(GCC 12 前有 bug)
  • 避免对同一 uint64_t 桶高频并发写不同位——虽然硬件通常 ok,但会引发 false sharing;桶大小设为 64 字节(10 个 uint64_t)能缓解
  • 如果真要读-改-写(比如 toggle),必须用 fetch_xor + 循环重试,别直接 load()/store()

如何快速统计已置位数量(popcount)

每次遍历数 1 的个数太慢。现代 CPU 都有 popcnt 指令,但得让编译器生成它——不能靠手写循环模拟。

std::bitset 是最省心的 fallback,但它是编译期大小;运行时位图得靠 std::popcount(C++20)或 __builtin_popcountll(GCC/Clang)。MSVC 用 _mm_popcnt_u64,需加 #include <nmmintrin.h></nmmintrin.h> 且确保编译选项打开 popcnt。

  • C++20 下直接对每个 uint64_t 元素调用 std::popcount(x),clang/gcc 会自动内联为 popcnt
  • 若需兼容 C++17,封装一层:inline int popcount(uint64_t x) { return __builtin_popcountll(x); }
  • 注意:未启用 -mpopcnt(GCC)或 /arch:AVX2(MSVC)时,__builtin_popcountll 可能退化为查表,性能差 5–10 倍

内存对齐与 mmap 大位图的 trick

当位图超过几百 MB,频繁 new/delete 会碎片化堆。这时候该换策略:用 mmap(Linux/macOS)或 VirtualAlloc(Windows)直接申请页对齐内存,并手动控制零初始化时机。

关键点不在“怎么映射”,而在“怎么避免首次访问全页清零”。Linux 的 MAP_ANONYMOUS | MAP_NORESERVE 配合 mmap 可延迟分配物理页,但 C++ 标准库没暴露这层控制——所以得裸调系统 API,或者用 std::pmr::polymorphic_allocator 配合自定义 memory_resource

  • 申请 1GB 位图(134M 个 uint64_t):用 mmap(nullptr, size, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS, -1, 0)
  • 别依赖 memset 初始化——用 madvise(addr, size, MADV_DONTNEED) 提前释放未用页
  • Windows 下对应用 VirtualAlloc(..., MEM_COMMIT | MEM_RESERVE, PAGE_READWRITE),但注意它默认提交全部物理内存

真正难的不是写到位,而是确定哪些位真的需要初始化——比如布隆过滤器的初始状态是全 0,但某些稀疏标记场景可以跳过清零,靠业务逻辑兜底。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
treenode的用法
treenode的用法

​在计算机编程领域,TreeNode是一种常见的数据结构,通常用于构建树形结构。在不同的编程语言中,TreeNode可能有不同的实现方式和用法,通常用于表示树的节点信息。更多关于treenode相关问题详情请看本专题下面的文章。php中文网欢迎大家前来学习。

544

2023.12.01

C++ 高效算法与数据结构
C++ 高效算法与数据结构

本专题讲解 C++ 中常用算法与数据结构的实现与优化,涵盖排序算法(快速排序、归并排序)、查找算法、图算法、动态规划、贪心算法等,并结合实际案例分析如何选择最优算法来提高程序效率。通过深入理解数据结构(链表、树、堆、哈希表等),帮助开发者提升 在复杂应用中的算法设计与性能优化能力。

27

2025.12.22

深入理解算法:高效算法与数据结构专题
深入理解算法:高效算法与数据结构专题

本专题专注于算法与数据结构的核心概念,适合想深入理解并提升编程能力的开发者。专题内容包括常见数据结构的实现与应用,如数组、链表、栈、队列、哈希表、树、图等;以及高效的排序算法、搜索算法、动态规划等经典算法。通过详细的讲解与复杂度分析,帮助开发者不仅能熟练运用这些基础知识,还能在实际编程中优化性能,提高代码的执行效率。本专题适合准备面试的开发者,也适合希望提高算法思维的编程爱好者。

42

2026.01.06

Golang 实际项目案例:从需求到上线
Golang 实际项目案例:从需求到上线

《Golang 实际项目案例:从需求到上线》以真实业务场景为主线,完整覆盖需求分析、架构设计、模块拆分、编码实现、性能优化与部署上线全过程,强调工程规范与实践决策,帮助开发者打通从技术实现到系统交付的关键路径,提升独立完成 Go 项目的综合能力。

17

2026.02.26

Golang Web 开发路线:构建高效后端服务
Golang Web 开发路线:构建高效后端服务

《Golang Web 开发路线:构建高效后端服务》围绕 Go 在后端领域的工程实践,系统讲解 Web 框架选型、路由设计、中间件机制、数据库访问与接口规范,结合高并发与可维护性思维,逐步构建稳定、高性能、易扩展的后端服务体系,帮助开发者形成完整的 Go Web 架构能力。

17

2026.02.26

Golang 并发编程专题:掌握多核时代的核心技能
Golang 并发编程专题:掌握多核时代的核心技能

《Golang 并发编程专题:掌握多核时代的核心技能》系统讲解 Go 在并发领域的设计哲学与实践方法,深入剖析 goroutine、channel、调度模型与并发安全机制,结合真实场景与性能思维,帮助开发者构建高吞吐、低延迟、可扩展的并发程序,全面提升多核时代的工程能力。

16

2026.02.26

batoto漫画官网入口与网页版访问指南
batoto漫画官网入口与网页版访问指南

本专题系统整理batoto漫画官方网站最新可用入口,涵盖最新官网地址、网页版登录页面及防走失访问方式说明,帮助用户快速找到batoto漫画官方平台,稳定在线阅读各类漫画内容。

431

2026.02.25

Steam官网正版入口与注册登录指南_新手快速进入游戏平台方法
Steam官网正版入口与注册登录指南_新手快速进入游戏平台方法

本专题系统整理Steam官网最新可用入口,涵盖网页版登录地址、新用户注册流程、账号登录方法及官方游戏商店访问说明,帮助新手玩家快速进入Steam平台,完成注册登录并管理个人游戏库。

130

2026.02.25

TypeScript全栈项目架构与接口规范设计
TypeScript全栈项目架构与接口规范设计

本专题面向全栈开发者,系统讲解基于 TypeScript 构建前后端统一技术栈的工程化实践。内容涵盖项目分层设计、接口协议规范、类型共享机制、错误码体系设计、接口自动化生成与文档维护方案。通过完整项目示例,帮助开发者构建结构清晰、类型安全、易维护的现代全栈应用架构。

41

2026.02.25

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
C# 教程
C# 教程

共94课时 | 10.3万人学习

C 教程
C 教程

共75课时 | 5万人学习

C++教程
C++教程

共115课时 | 19.5万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号