0

0

Linux 磁盘读写放大的成因

冰川箭仙

冰川箭仙

发布时间:2026-02-05 19:46:02

|

968人浏览过

|

来源于php中文网

原创

根本原因是SSD以4KB page为最小读写单位,小写需读-改-写整页,导致IO放大;机械盘则受限于sector(512B或4KB)对齐要求。

linux 磁盘读写放大的成因

达芬奇
达芬奇

达芬奇——你的AI创作大师

下载

为什么写1个字节,磁盘实际要写4KB?

根本原因在于硬件层的最小操作单元限制:SSD以page(通常4KB)为读写基本单位,机械盘则以sector(传统512B,现多为4K native)为准。当你发起一个未对齐的write()——比如偏移量是4097字节、长度1字节——底层无法只刷1字节,必须:

  • 读出整个目标page(4KB)到SSD控制器缓存;
  • 在内存中合并新数据;
  • 擦除原page(SSD不可覆写);
  • 把整页4KB写入新位置。
这1次逻辑写,触发了1次读 + 1次擦 + 1次写 → 实际IO放大3倍以上。更糟的是,若该page跨两个物理erase block,还可能引发额外迁移,进一步放大。

文件系统和分区不对齐,会雪上加霜

即使应用层写请求对齐,如果底层布局没对齐,照样放大。典型场景:

  • 分区起始扇区不是4096字节(8×512B)的整数倍 → fdisk -lStart列,若不是8的倍数,就是错的;
  • ext4格式化时没指定-E stride=128,stripe-width=256等RAID感知参数,导致元数据分布打乱对齐;
  • LVM物理扩展PE大小(默认4MB)与SSD pageerase block不匹配,中间多一层映射损耗。
结果是:你明明用O_DIRECT写了4KB对齐buffer,内核下发到底层的bio却仍被拆成多个非对齐request。

iostat -x里哪些指标暴露了读写放大?

光看wkB/sw/s不够,关键要看放大比:

  • 计算平均写大小:avgqu-sz / (w/s) 或直接看avgrq-sz(单位扇区);若长期(即
  • 对比r/sw/s:SSD负载下r/s ≪ w/srkB/s ≈ wkB/s,大概率在后台GC或rewrite;
  • 观察%util高但await异常飙升(如>50ms):说明请求在队列堆积,背后常是频繁的read-modify-write循环。
注意:iostat不显示底层擦除次数,需结合smartctl -a /dev/nvme0n1 | grep -i "media wear"看SSD磨损指标佐证。

避免放大的实操底线

不是所有场景都能根治,但守住这三条能拦住80%问题:

  • 新建分区时强制4K对齐:fdisk /dev/sdag(GPT)→ n → 回车让起始扇区默认从2048开始(=1MB对齐);
  • SSD上禁用barrierjournal开销(仅限数据盘):mkfs.ext4 -O ^has_journal /dev/sda1,挂载加noatime,nodiratime,discard
  • 应用写文件前检查buffer地址和offset:posix_memalign(&buf, 4096, size) + lseek(fd, offset & ~4095, SEEK_SET),再write()
真正难缠的从来不是单次写放大,而是日志型应用(如WAL、binlog)持续小写+fsync,这种必须配合io_uring提交聚合或换用libpmem直写持久内存——普通块设备上,对齐只是起点,不是终点。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

400

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

579

2023.08.10

磁盘配额是什么
磁盘配额是什么

磁盘配额是计算机中指定磁盘的储存限制,就是管理员可以为用户所能使用的磁盘空间进行配额限制,每一用户只能使用最大配额范围内的磁盘空间。php中文网为大家提供各种磁盘配额相关的内容,教程,供大家免费下载安装。

1457

2023.06.21

如何安装LINUX
如何安装LINUX

本站专题提供如何安装LINUX的相关教程文章,还有相关的下载、课程,大家可以免费体验。

709

2023.06.29

linux find
linux find

find是linux命令,它将档案系统内符合 expression 的档案列出来。可以指要档案的名称、类别、时间、大小、权限等不同资讯的组合,只有完全相符的才会被列出来。find根据下列规则判断 path 和 expression,在命令列上第一个 - ( ) , ! 之前的部分为 path,之后的是 expression。还有指DOS 命令 find,Excel 函数 find等。本站专题提供linux find相关教程文章,还有相关

296

2023.06.30

linux修改文件名
linux修改文件名

本专题为大家提供linux修改文件名相关的文章,这些文章可以帮助用户快速轻松地完成文件名的修改工作,大家可以免费体验。

784

2023.07.05

linux系统安装教程
linux系统安装教程

linux系统是一种可以免费使用,自由传播,多用户、多任务、多线程、多CPU的操作系统。本专题提供linux系统安装教程相关的文章,大家可以免费体验。

579

2023.07.06

linux查看文件夹大小
linux查看文件夹大小

Linux是一种自由和开放源码的类Unix操作系统,存在着许多不同的Linux版本,但它们都使用了Linux内核。Linux可安装在各种计算机硬件设备中,比如手机、平板电脑、路由器、视频游戏控制台、台式计算机、大型机和超级计算机。linux怎么查看文件夹大小呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

552

2023.07.20

java连接字符串方法汇总
java连接字符串方法汇总

本专题整合了java连接字符串教程合集,阅读专题下面的文章了解更多详细操作。

7

2026.02.05

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 8.5万人学习

Git 教程
Git 教程

共21课时 | 3.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号