0

0

Linux 文件系统是如何组织磁盘数据的?

舞夢輝影

舞夢輝影

发布时间:2026-01-23 20:26:03

|

650人浏览过

|

来源于php中文网

原创

chs与lba是磁盘寻址的两种方式,chs为物理三维坐标,lba为其线性映射;现代系统仅用lba,由固件或驱动完成转换,文件系统如ext4直接基于lba分配数据块。

linux 文件系统是如何组织磁盘数据的?

磁盘物理结构决定寻址方式:CHS 和 LBA 是什么关系?

Linux 文件系统不直接操作磁盘的物理表面,但它的底层设计必须适配磁盘的硬件组织逻辑。机械磁盘(HDD)由多个盘片、磁头、磁道、扇区和柱面构成,而定位任意一个 512字节 的扇区,传统上靠 CHS(柱面-磁头-扇区)三维坐标——比如 C=100, H=3, S=12。现代驱动固件早已把这套映射转为线性地址 LBA(Logical Block Address),操作系统只跟 LBA 打交道。

关键点在于:ext4 等文件系统分配数据块时,用的不是 CHS,而是从 0 开始编号的 LBA 块号;但内核 I/O 子系统最终仍需通过设备驱动将 LBA 转回 CHS(或由 SSD/NVMe 控制器内部再转译)。如果你在 dmesg 里看到 "I/O error on device sda, logical block 0x1a2b3c",那个十六进制数就是 LBA。

  • 不要手动算 CHS → LBA 公式(LBA = C × H × S + H × S + (S−1)),BIOS/固件已封装;但调试磁盘坏道时,hdparm --read-sectordd if=/dev/sda of=/dev/null bs=512 skip=123456 依赖的就是 LBA 偏移
  • SSD 虽无物理磁道,但仍模拟 LBA 接口,所以文件系统层无需修改;但“写放大”“磨损均衡”等行为发生在固件层,ext4 不知情
  • /sys/block/sda/queue/logical_block_size 查到的未必是 512 —— 很多新盘标称 4096(4K 扇区),此时一个逻辑块 = 8 个传统扇区,fdisk 对齐错误会导致性能暴跌

文件系统如何把“文件”变成磁盘上的块?inode 是核心枢纽

你在 ls -li 看到的第一列数字,就是 inode 编号。它不是文件名,而是指向一个固定大小(通常 256 字节)元数据结构的指针。这个结构里存着:文件类型、权限、所有者、时间戳、链接数,最关键的是——指向实际数据块的指针列表。

也就是说,/home/user/doc.txt 这个路径只是目录项(dirent)里的一个名字+inode号映射;真正读取内容时,内核先查目录找到 inode 号,再查 inode table 拿到数据块编号,最后去对应 LBA 位置读取。

卓丰企业网站管理系统英文版
卓丰企业网站管理系统英文版

新增功能: 1.增加文件下载系统; 2.美化后台登陆界面; 3.完善前后台登陆系统安全性; 4.后台登陆加了验证码; 5.修正组织结构的后台管理; 6.修正所有发现的小错误; 7.美化页面; 后台主要功能如下: 一、系统管理:管理员管理,可以新增管理员及修改管理员密码;数据库备份,为保证您的数据安全本系统采用了数据库备份功能;上传文件管理,管理你增加产品时上传的图片及其他文件。 二、企业信息:可

下载
  • 小文件(≤60 字节)可能直接塞进 inode 里(ext4 支持 inline data),不占额外数据块
  • 大文件用三级间接块:直接块(12 个)、一次间接块(指向块表)、二次间接块(指向块表的块表)……层级越多,访问延迟越高
  • stat /path/to/file 显示的 Blocks: 是按 512 字节单位统计的,和 du -b 不同;而文件系统分配是以 block size(如 4096)为单位,ls -l 显示的大小 ≠ 占用空间

超级块、块组、位图:文件系统怎么管理“空闲”与“已用”?

整个分区格式化成 ext4 后,开头第一个块就是 superblock,它记录了总块数、空闲块数、块大小、inode 总数等全局信息。但只靠一个超级块太危险——损坏就全盘崩溃。所以 ext4 在每个 block group(默认每 16384 个块一组)开头都备份一份超级块,并附带该组的 inode bitmapblock bitmap

这两个位图就是开关阵列:每个 bit 对应一个 inode 或一个数据块,“1”表示已用,“0”表示空闲。创建文件时,文件系统扫描位图找第一个 0,设为 1,再更新超级块里的空闲计数。

  • dumpe2fs -h /dev/sda1 看超级块摘要;dumpe2fs -x /dev/sda1 可导出位图二进制,但一般没必要——e2fsck -n 就能检查一致性
  • 删除文件 ≠ 清空数据块,只是把 inode 标记为未用、对应位图 bit 置 0;原数据还在,直到被新文件覆盖——这就是恢复工具(如 extundelete)的原理
  • 频繁小文件写入容易导致位图碎片化,ext4 默认启用 flex_bg(弹性块组)缓解,但 SSD 上影响不大

挂载与 VFS:为什么 /proc/sys 看起来像文件却不在磁盘上?

Linux 用虚拟文件系统(VFS)抽象所有存储后端:无论是真实磁盘上的 ext4、网络存储的 nfs,还是纯内存的 tmpfs,都统一提供 open()/read()/write() 接口。而 /proc/sys 是典型的伪文件系统(procfssysfs),它们根本没数据块,每次 cat /proc/meminfo 都是内核现场拼字符串返回。

这解释了为什么 df 显示 /proc 占用 0 字节,而 ls /proc 却能看到几百个“目录”——它们是内核数据结构的实时投影,不是磁盘映射。

  • mount -t proc proc /proc 是必需步骤,否则 /proc 下为空;但多数发行版启动时自动完成
  • 你不能对 /proc/sys/net/ipv4/ip_forward 执行 ln -s,因为它是只读接口;写入生效靠 echo 1 > ... 触发内核回调,不是改磁盘
  • /dev 下的设备文件(如 /dev/sda)也不是磁盘内容,而是内核设备模型的入口节点,访问它会触发驱动程序,而非读块设备
文件系统组织数据的复杂性,往往藏在“看不见”的地方:比如位图更新是否落盘(data=ordered vs data=writeback)、日志何时刷写(jbd2)、甚至 CPU 缓存行对齐是否影响 inode 访问效率。这些细节不常暴露,但一旦出问题(如断电后 ext4 报错 requiring fsck),根源几乎都在元数据与物理块映射的衔接环节。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
c语言中null和NULL的区别
c语言中null和NULL的区别

c语言中null和NULL的区别是:null是C语言中的一个宏定义,通常用来表示一个空指针,可以用于初始化指针变量,或者在条件语句中判断指针是否为空;NULL是C语言中的一个预定义常量,通常用来表示一个空值,用于表示一个空的指针、空的指针数组或者空的结构体指针。

254

2023.09.22

java中null的用法
java中null的用法

在Java中,null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量,包括类、接口、数组、字符串等。想了解更多null的相关内容,可以阅读本专题下面的文章。

1089

2024.03.01

if什么意思
if什么意思

if的意思是“如果”的条件。它是一个用于引导条件语句的关键词,用于根据特定条件的真假情况来执行不同的代码块。本专题提供if什么意思的相关文章,供大家免费阅读。

846

2023.08.22

scripterror怎么解决
scripterror怎么解决

scripterror的解决办法有检查语法、文件路径、检查网络连接、浏览器兼容性、使用try-catch语句、使用开发者工具进行调试、更新浏览器和JavaScript库或寻求专业帮助等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

492

2023.10.18

500error怎么解决
500error怎么解决

500error的解决办法有检查服务器日志、检查代码、检查服务器配置、更新软件版本、重新启动服务、调试代码和寻求帮助等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

377

2023.10.25

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

760

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

221

2023.09.04

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1565

2023.10.24

Go高并发任务调度与Goroutine池化实践
Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开,系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示,帮助开发者构建稳定高效的 Go 并发任务处理系统,提高系统在高负载环境下的处理能力与稳定性。

22

2026.03.10

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 10.5万人学习

Git 教程
Git 教程

共21课时 | 4.1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号