PostgreSQL采用客户端/服务器架构,由数据库实例、进程、内存和存储四部分构成;主进程postmaster管理连接并派生后端进程处理查询,后台进程负责写脏页、检查点、WAL写入、自动清理、归档和统计;共享缓冲区缓存数据页,WAL缓冲区暂存日志,work_mem用于排序哈希等操作,maintenance_work_mem用于维护任务,临时缓冲区服务会话级临时表,后端私有内存存储执行计划;数据存储于$PGDATA目录,base下按OID存放数据库文件,表索引以relfilenode命名并分段,WAL日志在pg_wal中保障持久性与复制,pg_xact记录事务状态,pg_tblspc链接自定义表空间;通过MVCC实现并发控制,基于xmin/xmax和事务快照判断可见性,VACUUM回收死亡元组,支持可重复读和串行化隔离级别,结合表锁、行锁与咨询锁保证一致性;整体设计模块化,兼顾性能与扩展性,适用于多类应用场景。

PostgreSQL 采用的是经典的客户端/服务器架构,整体设计清晰、模块化程度高,具备良好的可扩展性和稳定性。其体系结构主要由数据库实例、进程结构、内存结构和存储结构四大部分构成,下面逐一说明。
1. 进程结构
PostgreSQL 的运行依赖多个关键进程协同工作:
- 主进程(postmaster):是 PostgreSQL 的核心守护进程,负责启动和管理整个数据库实例。它监听客户端连接请求,并为每个新连接派生一个独立的后端服务进程。
- 后端服务进程(backend process):每个客户端连接都会触发 postmaster 创建一个专属的后端进程。该进程负责解析 SQL、执行查询、访问数据并返回结果。进程间彼此隔离,保障了并发安全。
-
后台辅助进程:
- writer process:将共享缓冲区中“脏页”写入磁盘,减少 Checkpoint 时的负载。
- checkpoint process:定期执行检查点操作,确保 WAL 日志与数据文件同步,提升崩溃恢复效率。
- wal writer process:将 WAL(Write-Ahead Logging)缓存写入磁盘,保障事务持久性。
- autovacuum launcher/process:自动清理死亡元组,回收空间并更新统计信息,避免表膨胀。
- archiver process:在归档模式下,将 WAL 文件复制到归档目录。
- stats collector:收集数据库运行状态信息,供监控和优化使用。
2. 内存结构
PostgreSQL 使用多种内存区域来提升性能和管理数据:
- Shared Buffers:共享内存区域,用于缓存数据页。所有后端进程共享此区域,是数据库性能的关键所在。大小通过 shared_buffers 参数配置。
- WAL Buffers:用于暂存 WAL 记录,在写入磁盘前保留在内存中。大小由 wal_buffers 控制。
- Work Mem:每个查询操作(如排序、哈希连接)可使用的内存量。复杂查询可能使用多个 work_mem 区域,需合理设置避免内存溢出。
- Maintenance Work Mem:用于 VACUUM、CREATE INDEX 等维护操作的内存上限。
- Temporary Buffers:为每个会话分配的临时表缓存,仅在会话生命周期内有效。
- Backend Private Memory:每个后端进程私有的内存空间,用于存放执行计划、函数调用栈等。
3. 存储结构
PostgreSQL 将数据以文件形式存储在磁盘上,目录结构清晰:
技术上面应用了三层结构,AJAX框架,URL重写等基础的开发。并用了动软的代码生成器及数据访问类,加进了一些自己用到的小功能,算是整理了一些自己的操作类。系统设计上面说不出用什么模式,大体设计是后台分两级分类,设置好一级之后,再设置二级并选择栏目类型,如内容,列表,上传文件,新窗口等。这样就可以生成无限多个二级分类,也就是网站栏目。对于扩展性来说,如果有新的需求可以直接加一个栏目类型并新加功能操作
- Data Directory($PGDATA):数据库集群的根目录,包含配置文件、子目录和全局对象。
- Global 目录:存放集群级系统表,如 pg_database、pg_authid 等。
- Base 目录:每个数据库对应一个子目录(以 OID 命名),内部包含该数据库的所有表和索引的数据文件。
- 表和索引文件:每个表或索引对应一个或多个磁盘文件,命名以其 relfilenode 为基础。大表会分段(segment),每段 1GB。
- WAL 日志(Write-Ahead Log):位于 pg_wal 目录,记录所有事务修改,用于崩溃恢复和流复制。
- pg_clog / pg_xact:存储事务提交状态(在较新版本中为 pg_xact),用于判断行版本可见性。
- pg_tblspc:存放指向用户定义表空间的符号链接。
- pg_stat_tmp:临时统计信息文件目录。
4. 逻辑与并发控制机制
PostgreSQL 使用多版本并发控制(MVCC)实现高并发下的数据一致性:
- 每一行数据带有事务版本信息(xmin/xmax),通过事务快照判断可见性。
- 事务不直接删除旧版本,而是标记为“死亡”,由 VACUUM 回收。
- 支持可重复读和串行化隔离级别,串行化使用 SSI(Serializable Snapshot Isolation)算法避免幻读。
- 锁机制包括表级锁、行级锁以及咨询锁,灵活应对不同场景。
基本上就这些。PostgreSQL 的架构设计兼顾性能、可靠与扩展,各组件职责明确,适合从中小型应用到大型企业系统的广泛场景。理解其结构有助于优化配置、排查问题和设计高可用方案。









