SQL 如何用 PERCENTILE_CONT / PERCENTILE_DISC 计算精确中位数

冷漠man

发布时间：2026-02-05 19:43:02

533人浏览过

来源于php中文网

原创

sql 如何用 percentile_cont / percentile_disc 计算精确中位数

PERCENTILE_CONT 和 PERCENTILE_DISC 的核心区别在哪

二者都用于计算分位数，但中位数（50% 分位）结果可能不同：PERCENTILE_CONT 线性插值，返回连续分布下的理论值；PERCENTILE_DISC 直接取排序后存在的实际值（向下取整逻辑），不插值。

比如数据 [1, 3, 5, 7]： - PERCENTILE_CONT(0.5) 插值得到 4.0（3 和 5 中间） - PERCENTILE_DISC(0.5) 返回 3（第 2 个值，即 floor((n+1)/2) = 2）

当需要严格等于原始数据中的某个值（如报表要求“真实出现过的中位销售额”），用 PERCENTILE_DISC
当需数学上更平滑的中心趋势（如统计建模输入），用 PERCENTILE_CONT
空值默认被忽略，但若列含大量 NULL，实际参与计算的行数会减少，结果易偏移

语法写错会导致直接报错或静默错误

常见硬伤：漏掉 WITHIN GROUP、括号位置错、ORDER BY 缺失。PostgreSQL / SQL Server / Oracle 都强制要求该结构，MySQL 不支持这两个函数（8.0+ 仅支持 PERCENT_RANK 等替代方案）。

正确写法长这样：

SELECT PERCENTILE_CONT(0.5) WITHIN GROUP (ORDER BY sales_amount) AS median_cont,
       PERCENTILE_DISC(0.5) WITHIN GROUP (ORDER BY sales_amount) AS median_disc
FROM orders;

PERCENTILE_CONT 和 PERCENTILE_DISC 是聚合函数，不能出现在 WHERE 或 GROUP BY 中，只能在 SELECT 或 HAVING（配合 GROUP BY）里用
WITHIN GROUP 括号内必须是单列 ORDER BY，不支持表达式如 ORDER BY ABS(price)（部分数据库报错）
参数必须是 0 到 1 的常量小数，不能是列名或子查询（如 PERCENTILE_CONT(pct_col) 会失败）

按组算中位数时容易漏掉 PARTITION BY

想算每个部门的中位薪资？别只加 GROUP BY dept——那会把整个函数当普通聚合用，报错或结果错乱。必须用窗口函数写法，靠 OVER + PARTITION BY。

达芬奇

达芬奇——你的AI创作大师

下载

例如 PostgreSQL 中正确写法：

SELECT dept,
       salary,
       PERCENTILE_CONT(0.5) WITHIN GROUP (ORDER BY salary) 
         OVER (PARTITION BY dept) AS dept_median
FROM employees;

如果误写成 GROUP BY dept, salary 再套 PERCENTILE_CONT，多数引擎会拒绝执行（因 WITHIN GROUP 要求无其他分组维度）
Oracle 支持 PERCENTILE_CONT 同时作为聚合和窗口函数；SQL Server 只支持窗口形式（即必须带 OVER）
注意：窗口版无法过滤掉中位数行本身（比如“只显示薪资高于本部门中位数的员工”），得用 CTE 先算中位数再 JOIN

NULL 值和数据类型会影响结果精度

这两函数对 NULL 统一跳过，但若字段是 STRING 类型（如评分用 'A'/'B'/'C'），ORDER BY 依赖字典序，PERCENTILE_DISC 返回的可能是 'B'，但业务上未必是“中间等级”——本质是排序位置中位，不是语义中位。

数值型字段推荐显式转为 DOUBLE PRECISION 或 DECIMAL，避免整数除法截断（如 PERCENTILE_CONT(0.5) 在全 INT 列上仍返回 DECIMAL，但某些旧版 PostgreSQL 可能截成整数）
日期字段可直接用（按毫秒排序），但注意时区：若 created_at 是 TIMESTAMP WITH TIME ZONE，不同地区用户看到的“中位创建时间”可能跨天
大数据量下（千万级），PERCENTILE_CONT 性能通常比 PERCENTILE_DISC 略差，因插值需额外浮点运算，不过差距一般在毫秒级

真正麻烦的是跨数据库移植：Snowflake 和 BigQuery 用 APPROX_QUANTILES 近似，Redshift 直到 2023 年才支持 PERCENTILE_CONT，且不支持窗口形式。业务 SQL 里硬写这两个函数前，先查清目标平台版本。

MySQL 如何用变量模拟窗口函数实现 running total

SQL 如何监控表碎片（MySQL OPTIMIZE TABLE 的触发条件）

MySQL 如何用 JSON_TABLE 展开 JSON 数组并聚合统计

SQL 如何用 STRING_AGG / GROUP_CONCAT 拼接分组内容并排序

如何用 TRUNCATE PARTITION 实现分区表分区清空不锁表

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：SQL 如何用 INSERT ... SELECT + ON DUPLICATE KEY 实现批量 upsert 下一篇：暂无

作者最新文章

paki小游戏免费入口快速指南_Poki小游戏免费在线秒玩入口

2026-02-04 14:59

Claude官网入口在哪里？Claude官方网站入口指引

2026-02-04 16:42

Claude官网在哪？Claude官方网站定位指南

2026-02-04 16:46

Python 文件上传与下载的实现要点

2026-02-04 17:05

ppt怎么删除文本框对象_ PPT选中删除文本框详细操作

2026-02-04 17:16

鹅鸭杀官方网站入口鹅鸭杀官网网站在线下载

2026-02-04 17:18

SQL 如何用 ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW 写法

2026-02-04 17:27

春晚2026节目单 2026春晚节目单完整版

2026-02-04 17:30

2026春节红包活动大全春节红包最新资讯

2026-02-04 17:37

Vivo云服务官网网址 vivo云服务官网登录

2026-02-04 17:52

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍：1、Excel，具有强大的计算和数据处理功能；2、SQL，可以进行数据查询、过滤、排序、聚合等操作；3、Python，拥有丰富的数据分析库；4、R，拥有丰富的统计分析库和图形库；5、Tableau，提供了直观易用的用户界面等等。

834

2023.10.12