0

0

【Linux】探索文件I/O奥秘,解锁软硬链接与生成动静态库知识

爱谁谁

爱谁谁

发布时间:2025-06-20 11:06:22

|

687人浏览过

|

来源于php中文网

原创

1、C文件接口1.1什么是当前路径?

进程开始启动时,进程所在的路径默认就是当前路径

1.2程序默认打开的文件流:stdin 标准输入,键盘设备stdout 标准输出,显示器设备stderr 标准错误,显示器设备

仔细观察发现,这三个流的类型都是FILE*, fopen返回值类型,文件指针,那什么是FILE类型呢?这是C标准库自己封装的一个结构体。

2、系统文件I/O

操作文件,除了C接口(当然,C++也有接口,其他语言也有),我们还可以采用系统接口来进行文件访问

为什么访问文件不仅仅有C语言上的文件接口,OS必须提供对应的访问文件的系统调用?

原因:

其实上述讲的C语言接口是OS系统调用函数的封装,系统调用函数封装了C语言接口,是为了可移植性和跨屏平台性!

2.1.接口介绍:2.1.1open:参数讲解;

pathname: 要打开或创建的目标文件

flags: 打开文件时,可以传入多个参数选项,用下面的一个或者多个常量进行“或”运算,构成flags。

O_RDONLY: 只读打开O_WRONLY: 只写打开O_RDWR : 读,写打开

上面这三个常量,必须指定一个且只能指定一个

O_CREAT : 若文件不存在,则创建它。需要使用mode选项,来指明新文件的访问权限O_APPEND: 追加写,不会将文件内容刷新,是进行内容的追加。

mode选项:

指明新文件的访问权限。

返回值: 成功:新打开的文件描述符 失败:-1

flags如何实现一个参数就可以有多个参数传参的效果?

我们通过flag标记位,看看哪个位上有1就输出哪一位,我们用位运算的方式来实现传多个参数的目的!

【Linux】探索文件I/O奥秘,解锁软硬链接与生成动静态库知识
【Linux】探索文件I/O奥秘,解锁软硬链接与生成动静态库知识
代码语言:javascript代码运行次数:0运行复制
int fd1 = open("log1.txt", O_WRONLY|O_CREAT|O_TRUNC, 0666);

所以我们的flags就实现一个参数就可以有多个参数传参的效果!

注意点:

不要往文件里面书写'/0',这样会造成乱码。我们要清楚'/0'本身并不是字符串内容的一部分,而是指明字符串结束的标志。

open 函数具体使用哪个,和具体应用场景相关,如目标文件不存在,需要open创建,则第三个参数表示创建文件的默认权限,否则,使用两个参数的open。

open函数的返回值:

open函数的返回值文件描述符到底是什么呢?

在认识返回值之前,先来认识一下两个概念: 系统调用 和 库函数

上面的 fopen fclose fread fwrite 都是C标准库当中的函数,我们称之为库函数(libc)。而, open close read write lseek 都属于系统提供的接口,称之为系统调用接口回忆一下我们讲操作系统概念时,画的一张图
【Linux】探索文件I/O奥秘,解锁软硬链接与生成动静态库知识

系统调用接口和库函数的关系,一目了然。 所以,可以认为,f#系列的函数,都是对系统调用的封装,方便二次开发

【Linux】探索文件I/O奥秘,解锁软硬链接与生成动静态库知识

C语言的文件接口,本质就是封装了系统调用!

3.文件描述符fd

通过对open函数的学习,我们知道了文件描述符就是一个小整数

3.1 0 & 1 & 2

Linux进程默认情况下会有3个缺省打开的文件描述符,分别是标准输入0, 标准输出1, 标准错误2. 0,1,2对应的物理设备一般是:键盘,显示器,显示器

文件描述符的本质就是数组下标!

当我们打开文件时,操作系统在内存中要创建相应的数据结构来描述目标文件。于是就有了file结构体。表示一个已经打开的文件对象。而进程执行open系统调用,所以必须让进程和文件关联起来。

3.2进程怎么知道了打开哪些文件呢?

每个进程都有一个指针*files, 指向一张表files_struct,该表最重要的部分就是包涵一个指针数组,每个元素都是一个指向打开文件的指针!所以,本质上,文件描述符就是该数组的下标。所以,只要拿着文件描述符,就可以找到对应的文件!

【Linux】探索文件I/O奥秘,解锁软硬链接与生成动静态库知识
3.3文件描述符的分配规则&&利用规则实现重定向fd的分配规则:

最小的没有被使用的数组下标,会分配给最新打开的文件

代码语言:javascript代码运行次数:0运行复制
#include #include #include #include #include int main(){close(1);int fd = open("myfile", O_WRONLY|O_CREAT, 00644);if(fd < 0){perror("open");return 1;}printf("fd: %d\n", fd);fflush(stdout);close(fd);exit(0);}

此时,我们发现,本来应该输出到显示器上的内容,输出到了文件 myfile 当中,其中,fd=1。这种现象叫做输出重定向。常见的重定向有:>, >>, 使用 dup2 系统调用

将旧的内容指向的指针指向了新,因此最后都只剩下old。

以后重定向只需要使用dup2函数即可。

直接完成重定向:

下图就是完成了输出重定向——>dup2(oldfd,1)

【Linux】探索文件I/O奥秘,解锁软硬链接与生成动静态库知识
【Linux】探索文件I/O奥秘,解锁软硬链接与生成动静态库知识
【Linux】探索文件I/O奥秘,解锁软硬链接与生成动静态库知识

照常还是从0里面读数据,但是我们不从键盘上读了,我们从log.txt里面进行读取

4.缓冲区问题4.1c语言为什么要存在语言层面上的缓冲区?

我们再调用fwrite的时候,有效减少我们调用系统中的write,我们要清楚调用系统调用是有成本的,时间和空间的成本,每次调用fwrite,我们可能把数据放在了语言层面的缓冲区,有效减少调用系统调用的次数,也是减少了系统拷贝的次数!本质就是用空间换时间,增加效率。

4.2那什么时候开始刷新到系统当中的缓冲区呢?无刷新,无缓冲行刷新——显示器,xxxxx\n,遇到换行符就会刷新全缓冲,全部刷新——普通文件,缓冲区被写满,才会刷新自己调用fflush函数强制刷新进程退出的时候,要自动刷新4.3缓冲区在哪里呢?

就在file*指向的结构体里面

每个文件都有一个缓冲区

4.4与fork函数的结合

为什么C语言层面的fwrite和fprintf写了两份,而write只写了一份?

【Linux】探索文件I/O奥秘,解锁软硬链接与生成动静态库知识

fork之前就已经把3条消息打印出来了,如果向显示器进行打印,刷新方案就是行

【Linux】探索文件I/O奥秘,解锁软硬链接与生成动静态库知识

write是直接将内容输入到了系统内部的缓冲区当中,而C语言调用的fwrite是将内容放在了语言层面的缓冲区。C语言层面的缓冲区是在FILE里面的。一旦利用write将内容放在了系统内部,那么就跟进程没有关系了

fwrite函数重定向到了普通文件,那么刷新策略就会变成全刷新,而write是输出到显示器上的,因此就是行刷新!

重定向之后,对test.txt刷新策略,缓冲区刷新策略立即变成了全缓冲,因为不会把缓冲区填满,所以在调用fork函数的时候,内容还在缓冲区当中。所以只有在进程结束的时候才会刷新缓冲区,缓冲区内保存的是进程的数据,——父进程的数据,对缓冲区进行写时拷贝,父进程有一份,子进程也有一份,所以最后才会输出两次

write函数因为是行刷新,在fork之前就已经刷新缓冲区了,就不存在将缓冲区的内容写时拷贝到子进程的情况

【Linux】探索文件I/O奥秘,解锁软硬链接与生成动静态库知识
5、关于磁盘等相关硬件知识

系统中是不是所有的文件都被打开了呢?大部分文件都是没有被打开的。如果没有被打开的文在哪里保存呢?

答:在磁盘、SSD当中保存,那么OS要不要管理一下磁盘上的文件呢?一定要,那现在的问题就是如何让OS快速定位一个文件!

5.1、磁盘的机械构成
【Linux】探索文件I/O奥秘,解锁软硬链接与生成动静态库知识
【Linux】探索文件I/O奥秘,解锁软硬链接与生成动静态库知识
5.2、磁盘的物理存储

每个磁盘是由一个一个小的同心圆也就是磁道组成的。

扇区:是磁盘IO的基本单位

如果我想访问磁盘中一个扇区:通过磁头进行定位到具体的磁道/柱面(cylinder),然后确定使用哪一个磁头(head),最后再确定哪一个扇区(sector)。这就是我们的CHS定位法!

那么任何文件,不就是多个扇区承载的数据!

5.3、磁盘的逻辑存储

我们其实可以把磁盘的存储当成线性结构来看待(磁带当中的长线条)。

因此我们对磁盘的管理,就变成了对数组的增删改查!

喜鹊标书
喜鹊标书

AI智能标书制作平台,10分钟智能生成20万字投标方案,大幅提升中标率!

下载

我们可以采用分治的思想,将很大的内存分成多个小块,我们对每一个小块内存的管理模式可以逐个采用到其他小块,这样我们就能根据分治的思想管理更大的内存!

5.4文件系统

比如说我们将800个GB分成多个小块内存,分成10个GB,那么我们如何管理这10个GB内存的空间呢?

【Linux】探索文件I/O奥秘,解锁软硬链接与生成动静态库知识

磁盘是典型的块设备,硬盘分区被划分为一个个的block。一个block的大小是由格式化的时候确定的,并且不可以更改。

Linux磁盘文件特性:文件 = 内容 + 属性。

内容和属性分开存储,文件名不属于文件属性!系统中,标识一个文件,用的不直接是文件名,而是inode!

Block Group:ext2文件系统会根据分区的大小划分为数个Block Group。而每个Block Group都有着相同的结构组成。将一个大的内存分成多个小块。超级块(Super Block):存放文件系统本身的结构信息。记录的信息主要有:bolck 和 inode的总量,未使用的block和inode的数量,一个block和inode的大小,最近一次挂载的时间,最近一次写入数据的时间,最近一次检验磁盘的时间等其他文件系统的相关信息。Super Block的信息被破坏,可以说整个文件系统结构就被破坏了!(最重要!)块位图(Block Bitmap):Block Bitmap中记录着Data Block中哪个数据块已经被占用,哪个数据块没有被占用inode位图(inode Bitmap):每个bit表示一个inode是否空闲可用。i节点表(inode table):存放文件属性。如 文件大小,所有者,最近修改时间等数据区(data block):存放文件内容注意:

inode编号,在整个分区内唯一,不是在分组内唯一!

找一个文件,就是通过inode编号找,前提是你怎么知道你的文件在哪一个分组里面

super block为什么不每一份文件就存储一份?

这样效率太慢

super block为什么不具有唯一性:

增加容错率,如果只有一份,如果这一份信息被破坏,那么后面整个文件系统都被破坏掉了,存储多余的几份相当于备份!

inode存属性,data block存储内容

1、那我们的文件名在哪里呢?

任何一个普通文件的文件名,一定在一个目录当中!

目录是不是文件?是的!目录里面存储着文件编号(inode)+目录的内容(对应该目录存储的每一个文件名,inode编号的映射关系)

2、重谈文件的增删改查:

如果一个目录没有r,w,x权限,是创建不了文件的!因为对应着改目录文件的内容。对于一个文件,进行增删改查,都和该文件所处的目录有关系!

访问一个文件,可以根据路径前缀,优先区分出文件在哪一个分区下!

6.软硬连接:6.1、操作观察现象:软连接:本质是一个文件,有独立的inode
【Linux】探索文件I/O奥秘,解锁软硬链接与生成动静态库知识
硬连接:本质不是一个独立的文件,因为它的inode编号和目标文件相同!
【Linux】探索文件I/O奥秘,解锁软硬链接与生成动静态库知识

那硬连接出来的到底是什么呢?

一定没有新建文件,但是新的文件名,和目标文件inode构成了不同的映射关系。

6.2、软硬链接的原理

硬链接本质就是在指定的目录下,插入新的文件名和目标文件的映射关系,并让inode的引用计数++。还是同一个文件

软链接本质就是一个独立文件,软链接里面放的是目标文件的路径!软链接类似Windows下的快捷方式

6.3、软硬链接的应用场景:软链接:对应文件的删除

删除文件时,本质是将映射关系删除,也就是引用计数--,只有当引用计数inode减到0的时候,才会真正删除文件,真正删除文件也只是讲文件的位图变成0,这也对应着我们平时删除文件的速度很快,跟下载文件的速度不成正比的原因

硬链接:

一个目录下有多少个子目录:硬连接数-2 计算得到

为什么是-2呢???

就算新建一个空目录,那么这个空目录的硬连接数就是2!

我们创建一个普通文件时,发现硬连接数就是1,因为此时的inode和文件名就一组映射关系,所以就是1.

但是创建一个空目录时,除了目录名本身的映射关系,还有. 这个文件。任何一个目录都会存在. 和.. 这两个文件,因此还有.这个映射关系,因此空硬链接数就是2!

如果此时在这个空目录下创建一个文件,那么这个目录的硬链接数就变成了3,因为还有新建文件的..增加的原先目录的映射关系

7、动静态库:7.1基础认知

默认编译程序,用的是动态链接,如果要静态链接,-static

如果我们同时提高动态库和静态库,gcc默认使用的是动态库

如果我们只提供静态库,那么可执行程序只能对该库进行静态链接,但是程序不一定整体是静态链接的。

如果我们只提供动态库,默认只能动态链接,非得静态链接,会发生链接报错!

动态库的名称:libXXX.so

静态库的名称:libYYY.a

库的真实名字去掉前缀和后缀,就是XXX,YYY

7.2为什么要有库:

1、提高开发效率。

2、隐藏源代码,因为我们打包的wenjian

7.3我们如何将目标文件进行打包形成一个库文件呢?7.3.1生成静态库
【Linux】探索文件I/O奥秘,解锁软硬链接与生成动静态库知识

这里命令行是ar -rc,r的意思是替换,如果当前目录下存在相同名字的库就会替换原先的内容;c的意思是create,如果当前路径下不存在这个库,我们就自己进行一个创建

【Linux】探索文件I/O奥秘,解锁软硬链接与生成动静态库知识

这里编译链接的时候已经将库包含了,为什么会报错呢?

因为gcc默认只识别C语言的库,我们自己创建的库不识别,因此我们就需要一个新命令:

-l库名,但此时也会报错,因为操作系统并不知道我们这个库具体在哪边,这时候就需要我们告诉编译器这个库是在当前路径当中!加上.文件

【Linux】探索文件I/O奥秘,解锁软硬链接与生成动静态库知识
【Linux】探索文件I/O奥秘,解锁软硬链接与生成动静态库知识

那如何不设置-L,我们该怎么办呢?

直接将库进行安装(拷贝)到系统中通过软链接的方式:
【Linux】探索文件I/O奥秘,解锁软硬链接与生成动静态库知识

我们也可以将我们的头文件安装到系统默认的头文件当中,把我们自己创建的库安装到系统默认的库,但是并不建议

静态库的本质是将代码拷贝到我们的程序当中,只要编译成功,形成可执行程序,那么后续就不需要静态库了

上面是静态库的使用,下面是我们的动态库的使用

7.3.2生成动态库

先将源文件编译成可执行文件。

shared: 表示生成共享库格式 fPIC:产生位置无关码(position independent code) 库名规则:libxxx.so

【Linux】探索文件I/O奥秘,解锁软硬链接与生成动静态库知识

生成.o文件需要加上fPIC选项

动态库只需要加载一次,剩下的只需要在不同的进程地址空间进行映射就可以找到了

打包方法:

【Linux】探索文件I/O奥秘,解锁软硬链接与生成动静态库知识

相关专题

更多
C语言变量命名
C语言变量命名

c语言变量名规则是:1、变量名以英文字母开头;2、变量名中的字母是区分大小写的;3、变量名不能是关键字;4、变量名中不能包含空格、标点符号和类型说明符。php中文网还提供c语言变量的相关下载、相关课程等内容,供大家免费下载使用。

391

2023.06.20

c语言入门自学零基础
c语言入门自学零基础

C语言是当代人学习及生活中的必备基础知识,应用十分广泛,本专题为大家c语言入门自学零基础的相关文章,以及相关课程,感兴趣的朋友千万不要错过了。

616

2023.07.25

c语言运算符的优先级顺序
c语言运算符的优先级顺序

c语言运算符的优先级顺序是括号运算符 > 一元运算符 > 算术运算符 > 移位运算符 > 关系运算符 > 位运算符 > 逻辑运算符 > 赋值运算符 > 逗号运算符。本专题为大家提供c语言运算符相关的各种文章、以及下载和课程。

353

2023.08.02

c语言数据结构
c语言数据结构

数据结构是指将数据按照一定的方式组织和存储的方法。它是计算机科学中的重要概念,用来描述和解决实际问题中的数据组织和处理问题。数据结构可以分为线性结构和非线性结构。线性结构包括数组、链表、堆栈和队列等,而非线性结构包括树和图等。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

257

2023.08.09

c语言random函数用法
c语言random函数用法

c语言random函数用法:1、random.random,随机生成(0,1)之间的浮点数;2、random.randint,随机生成在范围之内的整数,两个参数分别表示上限和下限;3、random.randrange,在指定范围内,按指定基数递增的集合中获得一个随机数;4、random.choice,从序列中随机抽选一个数;5、random.shuffle,随机排序。

597

2023.09.05

c语言const用法
c语言const用法

const是关键字,可以用于声明常量、函数参数中的const修饰符、const修饰函数返回值、const修饰指针。详细介绍:1、声明常量,const关键字可用于声明常量,常量的值在程序运行期间不可修改,常量可以是基本数据类型,如整数、浮点数、字符等,也可是自定义的数据类型;2、函数参数中的const修饰符,const关键字可用于函数的参数中,表示该参数在函数内部不可修改等等。

524

2023.09.20

c语言get函数的用法
c语言get函数的用法

get函数是一个用于从输入流中获取字符的函数。可以从键盘、文件或其他输入设备中读取字符,并将其存储在指定的变量中。本文介绍了get函数的用法以及一些相关的注意事项。希望这篇文章能够帮助你更好地理解和使用get函数 。

640

2023.09.20

c数组初始化的方法
c数组初始化的方法

c语言数组初始化的方法有直接赋值法、不完全初始化法、省略数组长度法和二维数组初始化法。详细介绍:1、直接赋值法,这种方法可以直接将数组的值进行初始化;2、不完全初始化法,。这种方法可以在一定程度上节省内存空间;3、省略数组长度法,这种方法可以让编译器自动计算数组的长度;4、二维数组初始化法等等。

600

2023.09.22

高德地图升级方法汇总
高德地图升级方法汇总

本专题整合了高德地图升级相关教程,阅读专题下面的文章了解更多详细内容。

72

2026.01.16

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 7.4万人学习

Django 教程
Django 教程

共28课时 | 3.2万人学习

Excel 教程
Excel 教程

共162课时 | 12.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号