SQL ClickHouse 的 MergeTree 引擎家族（Replacing / Summing / Aggregating）选型指南

冰川箭仙

发布时间：2026-02-15 15:36:59

692人浏览过

来源于php中文网

原创

replacingmergetree适合最终一致去重，依赖后台合并而非实时去重，需显式指定order by和可选version列；summingmergetree要求非聚合列必须为排序键前缀；aggregatingmergetree必须配合aggregatefunction类型及state/merge函数使用。

sql clickhouse 的 mergetree 引擎家族（replacing / summing / aggregating）选型指南

ReplacingMergeTree 适合去重但不保证实时性

当你需要按主键去重、且能接受“最终一致”时，ReplacingMergeTree 是最常用的选择。它靠后台合并（merge）阶段删除重复行，不是写入时即时去重。

常见错误现象：SELECT * FROM table 仍看到重复数据；OPTIMIZE TABLE 后才变干净；用 FINAL 查询又慢又锁表。

必须显式指定排序键（ORDER BY），去重依据是该键 + version 列（可选），版本大的保留
不设 version 列时，最后写入的行胜出，但无法控制“最后”是哪一次 —— 合并顺序由 ClickHouse 内部调度决定
FINAL 查询会强制触发合并，线上慎用；高并发写入下，ReplacingMergeTree 的去重延迟可能达分钟级
如果业务要求“写入即可见最新”，别用它，改用物化视图 + ReplacingMergeTree 预聚合，或直接上 VersionedCollapsingMergeTree

SummingMergeTree 要求严格分组聚合，不能混用非聚合列

SummingMergeTree 在 merge 时自动对指定列求和，但前提是：所有非聚合列必须是排序键的前缀，否则数据会“被截断”或聚合错乱。

使用场景：用户行为计数、订单金额累加等明确可加和的指标汇总。

灵图AI

灵图AI辅助设计平台

下载

定义引擎时用 SUMMINGMERGETREE(<code>sum_col1, sum_col2) 指定求和列；其余列必须全部包含在 ORDER BY 中，且顺序一致
如果漏掉某个非聚合列在 ORDER BY 里，ClickHouse 不报错，但 merge 后该列值取“任意一行”，结果不可预测
它不处理 null 合并：两个 NULL 求和仍是 NULL，不是 0；需要提前用 coalesce(col, 0) 清洗
性能上比 MergeTree 略低，因为每次 merge 都要计算求和；但比手动 GROUP BY 查询快得多

AggregatingMergeTree 必须配 Combine 类型字段，否则聚合失效

AggregatingMergeTree 不是自动聚合，而是依赖 AggregateFunction 类型字段存中间状态。写入不用聚合函数？那它跟普通 MergeTree 没区别。

错误典型：CREATE TABLE ... (metric SimpleAggregateFunction(sum, UInt64)) 写法已废弃，新版必须用 AggregateFunction(sum, UInt64) + State / Merge 函数配合。

写入必须用 xxxState() 函数，例如 sumState(clicks)；直接插原始值会导致后续 xxxMerge() 计算失败
查询必须用 xxxMerge()，例如 sumMerge(metric)；漏掉就返回二进制 blob，不是数字
不支持在 WHERE 中直接过滤 AggregateFunction 字段，得先 Merge 再过滤，或用物化视图预展开
磁盘占用比 SummingMergeTree 高 2–3 倍，因存的是序列化状态；适合复杂指标（如 uniq、topK、quantile）

引擎选型卡点：排序键设计决定一切

三个引擎都强依赖 ORDER BY，但它不是“为了排序”，而是划分数据分片和合并粒度的依据。选错排序键，再好的引擎也白搭。

ReplacingMergeTree：把去重维度全放前面，比如 ORDER BY (user_id, event_type, date)；加 date 可限制合并范围，避免跨月数据被误删
SummingMergeTree：非聚合列必须是排序键前缀，例如想按 (user_id, date) 汇总，就不能只写 ORDER BY user_id
AggregatingMergeTree：排序键需覆盖所有用于分组的维度，否则 Merge 时不同分组状态会被混在一起，结果发散
ClickHouse 不支持多级排序键“优先级”，ORDER BY (a, b) 和 ORDER BY (b, a) 物理存储完全不同，改了就得重建表

真正难的不是选哪个引擎，而是想清楚：你的数据按什么维度分片、哪些字段必须对齐、下游查询是否允许延迟。这些没理清，换引擎只是把问题从运行时搬到 schema 设计阶段。

相关标签:

sql NULL select date 并发 table clickhouse

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：SQL optimizer_switch 的 index_merge_union 开关效果实测下一篇：SQL 订单管理系统 SQL 实战

作者最新文章

漫蛙MANWA2官方网站入口漫蛙2MANWA2官方正版下载

2026-02-13 10:48

AO3HOMEARCHIVE-OF-OUR-OWN镜像网页入口

2026-02-13 10:48

字幕格式转换怎么弄_在线字幕格式转换操作教程

2026-02-13 10:54

发票抽奖老是显示未录入信息怎么办发票抽奖疑难解答

2026-02-13 11:24

消费品以旧换新政策怎么参与？两新两重政策是指什么

2026-02-13 11:45

网吧电脑怎么查看回放

2026-02-13 12:04

有兽焉动漫全集免费观看完整版有兽焉动漫新OP官网入口

2026-02-13 12:06

战神三部曲重制版官网战神三部曲重制版网页链接

2026-02-13 12:11

oppo官网买手机靠谱吗分析_OPPO官方商城购买手机可靠指南

2026-02-13 12:17

高级交互图表怎么设计？高级交互图表设计思路说明

2026-02-13 12:36

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

AI 图片处理图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍：1、Excel，具有强大的计算和数据处理功能；2、SQL，可以进行数据查询、过滤、排序、聚合等操作；3、Python，拥有丰富的数据分析库；4、R，拥有丰富的统计分析库和图形库；5、Tableau，提供了直观易用的用户界面等等。

943

2023.10.12