PostgreSQL 数组聚合 array_agg 与 string_agg 的性能对比

冷漠man

发布时间：2026-01-30 21:15:10

192人浏览过

来源于php中文网

原创

array_agg 本身不比 string_agg 显著慢，真正拖慢的是后续处理；空分隔符有风险；json_agg 比 array_agg 慢1.5–3倍；ORDER BY 在 array_agg 中非必须但几乎总应显式指定。

postgresql 数组聚合 array_agg 与 string_agg 的性能对比

array_agg 会显著拖慢查询速度吗？

在大多数场景下，array_agg 本身不比 string_agg 慢多少，真正拖慢的是后续对聚合结果的处理——比如你在应用层还要遍历、反序列化或做 JSON 转换。PostgreSQL 内部对两种函数都做了优化，底层都走相同的聚合框架，但 array_agg 需额外维护元素类型信息和内存结构，尤其当元素是复合类型（如 ROW 或嵌套数组）时，开销会上升明显。

实操建议：

如果只用于传输或展示，且客户端能直接消费数组（如 Python 的 psycopg2 默认返回 list），array_agg 更安全、无歧义
若字段含特殊字符（如逗号、双引号、换行），string_agg 需手动转义，否则解析易出错；这时表面快，实际埋坑
用 EXPLAIN (ANALYZE, BUFFERS) 对比两者执行计划，重点关注 Aggregate 节点的 Actual Total Time 和 Buffers 消耗，别只看“快几毫秒”

string_agg 的分隔符选空字符串有风险吗？

有，而且很常见。用 string_agg(col, '') 看似省事，但一旦 col 是 TEXT 且含 NULL，整个结果就变 NULL（因为 string_agg 默认跳过 NULL，但空分隔符下无法区分“全 NULL”和“空字符串拼接”）。更麻烦的是，它彻底丢失原始行边界——你无法还原哪几个值原属同一组。

实操建议：

永远显式处理 NULL：改用 string_agg(COALESCE(col::text, 'NULL'), ',')
避免空分隔符；若真需无缝拼接（如拼 SQL 片段），优先考虑 array_agg + 应用层 ''.join()
string_agg 在 GROUP BY 大量小字符串时内存更省，但一旦单组超 1MB，可能触发临时文件写入，反而比 array_agg 慢

JSON 聚合比 array_agg 更慢？

是的，json_agg（或 jsonb_agg）通常比 array_agg 慢 1.5–3 倍，因为它要执行类型推断、引号包裹、转义、编码验证。但注意：这不是“数组 vs 字符串”的问题，而是“裸数组 vs 序列化结构”的问题。如果你本就要返回 JSON 给前端，那提前在数据库里做 jsonb_agg 反而减少应用层序列化压力。

Flowith

一款GPT4驱动的节点式 AI 创作工具

下载

实操建议：

不要为了“看起来像 JSON”而用 to_json(array_agg(...)) —— 它比 jsonb_agg 多一次转换，还丢失 jsonb 的索引能力
若聚合字段类型固定（如全是 int），jsonb_agg 性能接近 array_agg；若混用 text/bool/null，开销陡增
用 pg_stat_statements 查看实际调用中 jsonb_agg 占总执行时间的比例，有些慢其实是上游 JOIN 导致的，不是聚合函数背锅

ORDER BY 在 array_agg 里必须写吗？

不是必须，但几乎总是应该写。PostgreSQL 不保证 array_agg 的元素顺序，除非显式加上 ORDER BY 子句。很多人测试时发现“没写也有序”，那是巧合——依赖了扫描顺序或 planner 的临时行为，上线后数据量变化或 vacuum 后可能突然乱序。

实操建议：

写法必须是：array_agg(col ORDER BY col) 或 array_agg(col ORDER BY id)，不能把 ORDER BY 放在外部
如果排序字段有重复值，加二级排序（如 ORDER BY col, ctid）避免非确定性
带 ORDER BY 的 array_agg 会触发额外 sort 节点，若已按该字段索引扫描，可利用索引避免排序；否则性能下降明显

真正影响性能的，往往不是选 array_agg 还是 string_agg，而是是否意识到聚合发生在分组之后、是否处理了 NULL、是否依赖未声明的顺序、以及下游是否真的需要那个格式。这些细节比函数名本身更值得盯住。

SQL 参数传递机制分析与优化应用技巧

SQL XML 数据转换与清洗实践

SQL JSON 数据校验与清洗实践

SQL注入如何防御_参数化查询安全方案解析【教程】

SQL数据库对象自动生成_SQL脚本批量构建方法

数码产品性能查询

该软件包括了市面上所有手机CPU，手机跑分情况，电脑CPU，电脑产品信息等等，方便需要大家查阅数码产品最新情况，了解产品特性，能够进行对比选择最具性价比的商品。

下载

相关标签:

python js 前端 json 编码 ai 聚合函数 gate sql json NULL sort 字符串 bool int postgresql 数据库

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：SQL 中字符串拼接 || 与 CONCAT() 在 NULL 处理上的差异下一篇：SQL 如何计算中位数（Median）的跨数据库写法

作者最新文章

Linux进程五种状态转换原理及R与D状态性能影响分析

2026-03-14 12:24

Linux系统中线程Thread与轻量级进程LWP内在联系分析

2026-03-14 12:41

MacOS系统针对外部存储的Spotlight索引禁用设置

2026-03-14 13:02

Windows运维中利用GPO配置无线网络配置文件自动连接

2026-03-14 13:14

Java中Apache缓存雪崩现象的预防与后端保护逻辑

2026-03-14 13:22

Linux系统卡死问题_内核日志分析

2026-03-14 13:34

Linux 大促场景性能优化_削峰填谷策略

2026-03-14 13:43

Linux日志切割配置_logrotate实践

2026-03-14 13:53

SQLSQL注入防护_输入校验与参数化查询

2026-03-14 14:02

SQL批量删除优化_DELETE与TRUNCATE对比

2026-03-14 14:51

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍：1、Excel，具有强大的计算和数据处理功能；2、SQL，可以进行数据查询、过滤、排序、聚合等操作；3、Python，拥有丰富的数据分析库；4、R，拥有丰富的统计分析库和图形库；5、Tableau，提供了直观易用的用户界面等等。

1135

2023.10.12