0

0

Linux PostgreSQL 高可用部署方案

舞姬之光

舞姬之光

发布时间:2026-02-23 19:40:35

|

943人浏览过

|

来源于php中文网

原创

pg_auto_failover 可上生产但需匹配运维能力,它仅协调流复制、故障探测与切换,不处理备份、wal损坏、网络分区脑裂等问题,须手动补全监控、归档、连接管理等关键环节。

linux postgresql 高可用部署方案

PostgreSQL 流复制 + pg_auto_failover 能不能直接上生产

能,但得先确认你的运维能力是否匹配它的“自动”程度。pg_auto_failover 本质是封装了流复制+故障探测+角色切换的协调器,不是开箱即用的黑盒——它不接管你的备份、不修复损坏的 WAL、也不帮你处理网络分区时的脑裂。

常见错误现象:node is marked as unhealthy 却查不到明显异常;waiting for primary to become healthy 卡住半天;failover 后应用连不上新主库(没更新连接串或 DNS 缓存)。

  • 必须提前配置好 pg_hba.conf,让所有节点(包括 monitor)能双向免密连接彼此的 PostgreSQL 实例,否则 monitor 根本无法探活
  • monitor 节点必须独立部署(别和 pg 实例混跑),否则它挂了整个高可用就失效
  • 应用层必须支持重连,且连接串里别写死单个 IP;推荐用 keepalived + VIP 或服务发现(如 Consul)解耦
  • pg_auto_failover 默认只监控进程存活和复制延迟,不检查磁盘满、WAL 归档失败等场景,这些得自己补监控项

流复制备库为什么迟迟不接受只读查询

因为还没真正进入“hot standby”状态——PostgreSQL 在恢复中会拒绝所有客户端连接,直到完成基础备份加载并开始接收 WAL 流。

使用场景:搭建完 standby 后执行 psql -h standby-host -c "SELECT 1" 报错 FATAL: the database system is starting up

  • 检查 pg_stat_replication 视图:主库上查不到该备库记录,说明流复制根本没连上(大概率是 postgresql.conf 没开 wal_level = replicamax_wal_senders 不够)
  • 检查备库 postgresql.log:出现 replication connection authorized 才算链路通了;若一直卡在 recovering,可能是 recovery.conf(或 standby.signal)缺失,或 primary_conninfo 里密码错了
  • 确认备库 postgresql.conf 中设置了 hot_standby = on,这个参数必须重启生效,且仅对 9.0+ 有效

pg_auto_failover 切换后应用报错 “FATAL: terminating connection due to administrator command”

这是正常现象,不是故障。failover 触发时,原主库会被 pg_auto_failover 执行 pg_ctl promote -w 或直接发 SIGTERM 强制终止所有连接,为的是确保数据一致性。

mallcloud商城
mallcloud商城

mallcloud商城基于SpringBoot2.x、SpringCloud和SpringCloudAlibaba并采用前后端分离vue的企业级微服务敏捷开发系统架构。并引入组件化的思想实现高内聚低耦合,项目代码简洁注释丰富上手容易,适合学习和企业中使用。真正实现了基于RBAC、jwt和oauth2的无状态统一权限认证的解决方案,面向互联网设计同时适合B端和C端用户,支持CI/CD多环境部署,并提

下载

性能 / 兼容性影响:这个中断时间取决于你设置的 failover_timeout(默认 10 秒)和应用重连逻辑——如果应用没设重试,就会直接报错退出。

  • 应用连接池(如 PgBouncer、HikariCP)必须开启 auto-commit 和连接验证(例如用 SELECT 1),并在连接异常时自动重建
  • 避免在事务中长时间 hold 连接;failover 窗口内未提交的事务一律回滚,没有“续传”这回事
  • 别依赖 PostgreSQL 自带的 application_name 做路由判断——切主后这个值不会变,容易把流量继续打到旧主(已降为备库)

归档 + PITR 跟高可用是两回事,别指望 pg_auto_failover 自动帮你恢复误删数据

流复制只同步物理块变化,PITR(基于时间点恢复)依赖的是归档的 WAL 文件和基础备份。pg_auto_failover 完全不碰归档配置,也不会触发 pg_basebackup

容易踩的坑:以为启用了高可用就等于有备份,结果 DROP TABLE 后发现只能回退到上次基础备份,中间几小时数据全丢。

  • 必须单独配置 archive_mode = onarchive_command(推荐用 rsyncaws s3 cp),并定期验证归档文件可读
  • 基础备份不能只做一次:用 pg_basebackup -X stream 配合 cron 定期执行,保留至少 2–3 份
  • 归档路径必须对所有节点可见(如 NFS 或对象存储),否则 failover 后新主库可能无法访问旧 WAL 继续恢复

最常被忽略的一点:monitor 节点本身不存任何 PostgreSQL 数据,它的数据库只是记录集群状态。一旦 monitor 磁盘损坏且没备份,整个集群的 failover 历史和当前拓扑就丢了——但它不影响正在运行的主从服务,这点要分清。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
discuz database error怎么解决
discuz database error怎么解决

discuz database error的解决办法有:1、检查数据库配置;2、确保数据库服务器正在运行;3、检查数据库表状态;4、备份数据;5、清理缓存;6、重新安装Discuz;7、检查服务器资源;8、联系Discuz官方支持。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

221

2023.11.20

postgresql常用命令
postgresql常用命令

postgresql常用命令psql、createdb、dropdb、createuser、dropuser、l、c、dt、d table_name、du、i file_name、e和q等。本专题为大家提供postgresql相关的文章、下载、课程内容,供大家免费下载体验。

163

2023.10.10

常用的数据库软件
常用的数据库软件

常用的数据库软件有MySQL、Oracle、SQL Server、PostgreSQL、MongoDB、Redis、Cassandra、Hadoop、Spark和Amazon DynamoDB。更多关于数据库软件的内容详情请看本专题下面的文章。php中文网欢迎大家前来学习。

998

2023.11.02

postgresql常用命令有哪些
postgresql常用命令有哪些

postgresql常用命令psql、createdb、dropdb、createuser、dropuser、l、c、dt、d table_name、du、i file_name、e和q等。更详细的postgresql常用命令,大家可以访问下面的文章。

210

2023.11.16

postgresql常用命令介绍
postgresql常用命令介绍

postgresql常用命令有l、d、d5、di、ds、dv、df、dn、db、dg、dp、c、pset、show search_path、ALTER TABLE、INSERT INTO、UPDATE、DELETE FROM、SELECT等。想了解更多postgresql的相关内容,可以阅读本专题下面的文章。

277

2023.11.20

PostgreSQL性能优化与索引调优实战
PostgreSQL性能优化与索引调优实战

本专题面向后端开发与数据库工程师,深入讲解 PostgreSQL 查询优化原理与索引机制。内容包括执行计划分析、常见索引类型对比、慢查询优化策略、事务隔离级别以及高并发场景下的性能调优技巧。通过实战案例解析,帮助开发者提升数据库响应速度与系统稳定性。

124

2026.02.12

数据库三范式
数据库三范式

数据库三范式是一种设计规范,用于规范化关系型数据库中的数据结构,它通过消除冗余数据、提高数据库性能和数据一致性,提供了一种有效的数据库设计方法。本专题提供数据库三范式相关的文章、下载和课程。

375

2023.06.29

如何删除数据库
如何删除数据库

删除数据库是指在MySQL中完全移除一个数据库及其所包含的所有数据和结构,作用包括:1、释放存储空间;2、确保数据的安全性;3、提高数据库的整体性能,加速查询和操作的执行速度。尽管删除数据库具有一些好处,但在执行任何删除操作之前,务必谨慎操作,并备份重要的数据。删除数据库将永久性地删除所有相关数据和结构,无法回滚。

2094

2023.08.14

pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法
pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法

本专题系统整理pixiv网页版官网入口及登录访问方式,涵盖官网登录页面直达路径、在线阅读入口及快速进入方法说明,帮助用户高效找到pixiv官方网站,实现便捷、安全的网页端浏览与账号登录体验。

1127

2026.02.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 9.6万人学习

Git 教程
Git 教程

共21课时 | 3.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号