0

0

什么是并发中的数据局部性(Data Locality)_优化多核并发缓存命中率的技巧

P粉602998670

P粉602998670

发布时间:2026-02-12 12:29:31

|

187人浏览过

|

来源于php中文网

原创

数据局部性指线程访问的数据尽量驻留在本核l1/l2缓存中,避免跨核迁移导致缓存失效;包括时间局部性(重复访问同一内存)和空间局部性(连续访问相邻地址),并发下二者均易失效,引发伪共享或重加载延迟。

什么是并发中的数据局部性(data locality)_优化多核并发缓存命中率的技巧

什么是并发中的数据局部性?

数据局部性在多核并发里不是“数据离得近”,而是“每个线程访问的数据,尽量只落在自己核心的L1/L2缓存里,不被别的核反复踢出”。它分两层:时间上重复用同一块内存(比如循环累加一个sum),空间上连续访问相邻地址(比如遍历std::vector而非std::list)。并发下失效的是前者——线程一迁移到另一核,刚热起来的sum就全丢了;后者失效更隐蔽——多个线程写不同变量却挤在同一cache line,引发伪共享。

为什么绑CPU核心能提升50%缓存命中率?

现代CPU的L1/L2缓存是每核私有。线程在核心0跑时,data[0]counter等热数据会常驻其L1缓存;一旦被调度器挪到核心3,这些数据全得从L3或内存重新加载,延迟跳到200+周期。实测中,未绑定亲和性的高吞吐线程池,L1命中率常低于40%;固定到单核后普遍回升至85%以上。

  • pthread_setaffinity_np必须在创建线程后、实际工作前调用,否则无效
  • 别把两个高负载线程绑到同一物理核的超线程逻辑核(如CPU 0 和 CPU 1),它们共用L1缓存,反而加剧竞争
  • NUMA节点下,要同步绑定内存分配策略:numactl --cpunodebind=0 --membind=0 ./app

怎么避免伪共享(False Sharing)?

伪共享不是代码写错,是结构体里两个int变量挨得太近,被塞进同一个64字节cache line,结果线程A改counter_a、线程B改counter_b,互相让对方的缓存行失效。现象是:CPU使用率飙高但吞吐上不去,perf看L1-dcache-load-misses异常高。

CodeWP
CodeWP

针对 WordPress 训练的AI代码生成器

下载
  • alignas(64)强制对齐,确保关键变量独占一行:
    struct alignas(64) WorkerStats {
        int64_t processed;
        int64_t errors;
    };
  • 别用__attribute__((aligned(64)))修饰单个int——编译器可能仍把它和邻近变量打包
  • 检查结构体大小是否为64的整数倍,否则末尾填充可能被后续变量“吃掉”

数组遍历顺序为何影响并发性能?

并发场景下,如果多个线程各自处理二维数组的一块区域,但用列优先(for j; for i)方式读写,每个线程实际访问的内存地址跨度极大,导致预取失效、cache line反复换入换出。尤其当数组大到超出L3缓存时,性能断崖式下跌。

  • 行优先(for i; for j)让每个线程连续扫一片内存,预取器能跟上,L2命中率稳定在90%+
  • 若必须列处理,改用循环分块(Loop Tiling):按64字节对齐的块大小切分,例如for (int ii = 0; ii (假设<code>int为4字节,16×4=64)
  • 别依赖编译器自动向量化——-O3可能优化掉你精心设计的分块,加#pragma GCC unroll 4更可控

真正难的不是知道要对齐或绑核,而是当你的WorkerStats嵌套在三层模板类里、又混着std::shared_ptr管理时,怎么定位哪个字节偏移触发了伪共享——这时候perf record -e cache-misses配合perf script看地址分布,比猜强得多。

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
golang结构体相关大全
golang结构体相关大全

本专题整合了golang结构体相关大全,想了解更多内容,请阅读专题下面的文章。

322

2025.06.09

golang结构体方法
golang结构体方法

本专题整合了golang结构体相关内容,请阅读专题下面的文章了解更多。

198

2025.07.04

string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

708

2023.08.02

int占多少字节
int占多少字节

int占4个字节,意味着一个int变量可以存储范围在-2,147,483,648到2,147,483,647之间的整数值,在某些情况下也可能是2个字节或8个字节,int是一种常用的数据类型,用于表示整数,需要根据具体情况选择合适的数据类型,以确保程序的正确性和性能。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

559

2024.08.29

c++怎么把double转成int
c++怎么把double转成int

本专题整合了 c++ double相关教程,阅读专题下面的文章了解更多详细内容。

193

2025.08.29

C++中int的含义
C++中int的含义

本专题整合了C++中int相关内容,阅读专题下面的文章了解更多详细内容。

206

2025.08.29

线程和进程的区别
线程和进程的区别

线程和进程的区别:线程是进程的一部分,用于实现并发和并行操作,而线程共享进程的资源,通信更方便快捷,切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

653

2023.08.10

2026春节习俗大全
2026春节习俗大全

本专题整合了2026春节习俗大全,阅读专题下面的文章了解更多详细内容。

54

2026.02.11

Yandex网页版官方入口使用指南_国际版与俄罗斯版访问方法解析
Yandex网页版官方入口使用指南_国际版与俄罗斯版访问方法解析

本专题全面整理了Yandex搜索引擎的官方入口信息,涵盖国际版与俄罗斯版官网访问方式、网页版直达入口及免登录使用说明,帮助用户快速、安全地进入Yandex官网,高效使用其搜索与相关服务。

154

2026.02.11

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号