SQL 正规化与反规范化实践案例

冷漠man

发布时间：2026-02-21 18:50:03

254人浏览过

来源于php中文网

原创

反规范化适用于读多写少、join导致i/o或连接数瓶颈的场景，如报表导出；需先用explain analyze确认扫描问题，再通过触发器或cdc同步冗余数据，避免应用层双写。

sql 正规化与反规范化实践案例

什么时候该用反规范化，而不是硬扛 JOIN 性能？

数据库查得慢，第一反应不是加索引，而是看 SQL 里嵌了多少层 JOIN。尤其在报表、宽表导出、实时看板这类场景，SELECT * 拉 5 张表，每张都带 WHERE 和 GROUP BY，响应时间从 200ms 跳到 2s，这时候反规范化不是“偷懒”，是权衡。

真实瓶颈在磁盘 I/O 或连接数耗尽，而非 CPU，说明查询计划已经反复扫表
数据变更频率低（比如用户基础信息每天同步一次），但读取频次极高（每秒数百次）
应用层做缓存成本高、一致性难维护，不如在 DB 层预计算好字段
JSON 字段或冗余列能避免跨库关联（比如订单表里存 user_name 而非只存 user_id）

别一上来就加冗余字段。先用 EXPLAIN ANALYZE 确认是不是 Nested Loop 在拖慢速度；如果执行计划里出现多次 Seq Scan 或 Bitmap Heap Scan 扫全表，再考虑反规范化。

冗余字段怎么同步才不丢数据？

最常见错误是靠应用层“写两次”：先插订单，再手动更新用户积分表。网络抖动、事务中断、代码分支遗漏，都会导致两边不一致。

用数据库原生机制：PostgreSQL 的 TRIGGER + FUNCTION，MySQL 的 BEFORE INSERT/UPDATE 触发器，确保同一事务内完成
避免在触发器里调远程 API 或写日志文件——这些操作失败会导致主 SQL 失败
如果涉及多表聚合（比如把用户所有订单金额 sum 存进 user.total_spent），触发器里必须检查 OLD 和 NEW 值，只对变化字段做 delta 更新，而不是每次都重算全量
对于无法用触发器覆盖的场景（如异构数据源同步），用 CDC 工具（如 Debezium）捕获 binlog，再由下游服务做幂等更新，比定时任务更可靠

注意：TRIGGER 在大批量 INSERT ... SELECT 或 COPY 时可能显著拖慢导入速度，测试时务必用真实数据量压测。

百度AI搜

百度全新AI搜索引擎

下载

JSON 字段是反规范化的捷径还是陷阱？

把地址、标签、配置项塞进 JSONB（PostgreSQL）或 JSON（MySQL 8.0+）看起来省事，但很快会遇到问题。

查询性能：想查“所有收货城市为北京的订单”，WHERE address->>'city' = '北京' 无法走普通 B-tree 索引，得建表达式索引：CREATE INDEX ON orders ((address->>'city'))
数据校验缺失：JSON 字段不阻止你存 {"city": 123} 这种类型错乱的数据，应用层必须自己校验结构
更新粒度粗：改一个字段就得重写整个 JSON，可能引发 MVCC 膨胀（尤其 PostgreSQL 中大 JSONB 字段频繁更新）
不支持外键约束，没法保证 user_id 在 JSON 里引用的是真实存在的用户

适合放 JSON 的，仅限那些“只读、结构松散、不参与 WHERE/GROUP/JOIN”的数据，比如埋点日志、前端表单快照、第三方回调原始 payload。

正规化回滚时，哪些字段最容易被漏掉？

项目后期发现反规范化太重，想退回到第三范式，常卡在“不知道哪些字段其实是冗余的”。

查数据库注释：COMMENT ON COLUMN 如果写过 "冗余自 users.name" 就很省事；没写的话，翻 Git 历史看建表语句的 commit message
检查唯一性约束：如果 order.user_name 和 users.name 总是一致，且没有单独修改 order.user_name 的业务逻辑，基本可判定为冗余
审计 UPDATE 日志：用 pg_stat_statements 或慢日志分析，看哪些字段几乎从不被单独更新（比如 product.category_name 自上线后只随 category_id 变更而批量更新）
最危险的是“表面冗余、实际承担业务逻辑”的字段，比如 user.cached_role 看似来自 role 表，但权限系统实际读它而非 join，删了就炸

真正难的不是技术还原，是厘清字段背后的语义契约——有些字段早就不只是“缓存”，而是成了新协议的一部分。

相关标签:

sql mysql json select copy function column git postgresql 数据库

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：SQL Vitess 的 VTGate / VTTablet / VTCoord 的分层架构与查询路由实践下一篇：暂无

作者最新文章

腾讯会议视频会议前要做哪些准备

2026-02-19 13:16

Linux /proc/sys/net/ipv4/ip_local_port_range 的 ephemeral port 范围扩展

2026-02-19 13:19

Python 动态属性注入的风险与治理

2026-02-19 13:20

Linux 系统救援模式使用教程

2026-02-19 13:31

Linux btrfs vs ext4 vs xfs 的文件系统特性与生产数据库选型 2026

2026-02-19 13:34

如何设置edge浏览器主页图标固定网站与快捷方式设置

2026-02-19 13:37

edge如何设置无痕浏览快捷方式与策略配置方法

2026-02-19 13:57

SQL 数据修改的回滚与恢复技巧

2026-02-19 14:09

Python 数据校验放在边界层的原因

2026-02-19 14:12

京东营业执照怎么办理？京东营业执照在哪里看

2026-02-19 14:20

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

AI 图片处理图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍：1、Excel，具有强大的计算和数据处理功能；2、SQL，可以进行数据查询、过滤、排序、聚合等操作；3、Python，拥有丰富的数据分析库；4、R，拥有丰富的统计分析库和图形库；5、Tableau，提供了直观易用的用户界面等等。

1006

2023.10.12