PERCENT_RANK() / CUME_DIST() 在排名分析中的实际应用

舞夢輝影

发布时间：2026-01-30 21:04:17

903人浏览过

来源于php中文网

原创

PERCENT_RANK()基于(当前行排名−1)/(总行数−1)，首行为0；CUME_DIST()基于≤当前值的行数/总行数，首行可能>0；二者均无视FRAME子句，不支持滚动计算。

percent_rank() / cume_dist() 在排名分析中的实际应用

PERCENT_RANK() 和 CUME_DIST() 的核心区别在哪

两者都返回 [0, 1] 区间的浮点数，但计算逻辑完全不同：PERCENT_RANK() 基于「当前行排名减 1」除以「总行数减 1」，首行永远是 0；CUME_DIST() 是「小于等于当前值的行数」除以「总行数」，首行可能大于 0（如有重复值）。实际中，如果你需要反映“排在某值之前的比例”，用 PERCENT_RANK()；如果关注“包含当前值在内的累计占比”，必须用 CUME_DIST()。

ORDER BY 中存在重复值时结果差异明显

当排序字段有重复（比如多个用户得分都是 85），PERCENT_RANK() 会给这些重复行分配相同排名，但分母仍是 COUNT(*) - 1，导致它们共享一个百分位；而 CUME_DIST() 会把所有 85 分的行一起计入分子，因此其结果跳变更平缓。例如 5 行数据中，3 行并列第 2 名：

SELECT score,
       PERCENT_RANK() OVER (ORDER BY score) AS pr,
       CUME_DIST() OVER (ORDER BY score) AS cd
FROM (VALUES (70), (85), (85), (85), (92)) t(score);

结果中三个 85 分的 pr 都是 0.25（即 (2−1)/(5−1)），但 cd 都是 0.6（即 3/5）。

窗口 FRAME 子句对这两个函数完全无效

PERCENT_RANK() 和 CUME_DIST() 不支持 ROWS BETWEEN 或 RANGE BETWEEN —— 它们始终在整个窗口内计算，忽略你写的 frame_clause。试图写成 PERCENT_RANK() OVER (ORDER BY x ROWS UNBOUNDED PRECEDING) 不报错，但效果和不写一样。这点和 AVG()、SUM() 等聚合型窗口函数截然不同，容易误以为能做“滚动百分位”，实际做不到。

PHP5 和 MySQL 圣经

本书是全面讲述PHP与MySQL的经典之作，书中不但全面介绍了两种技术的核心特性，还讲解了如何高效地结合这两种技术构建健壮的数据驱动的应用程序。本书涵盖了两种技术新版本中出现的最新特性，书中大量实际的示例和深入的分析均来自于作者在这方面多年的专业经验，可用于解决开发者在实际中所面临的各种挑战。

下载

替代方案：需要滚动或分组内独立排名时怎么办

若真要按时间窗口或业务分组动态算占比，得绕开这两个函数：

用 COUNT(*) FILTER (WHERE ...) + COUNT(*) OVER (PARTITION BY ...) 手动构造比例
对分组内排序后用 ROW_NUMBER() 和 COUNT() OVER (PARTITION BY ...) 模拟 PERCENT_RANK()
注意 PostgreSQL 14+ 支持 WITHIN GROUP 语法用于聚合函数，但不适用于窗口场景

真正难处理的是既要分组、又要处理重复值、还要求严格语义对齐的场景——这时候别硬套 PERCENT_RANK()，先确认业务到底要“相对位置”还是“覆盖密度”。

REPEATABLE READ vs READ COMMITTED 的业务影响对比

如何用 VALUES 子句 + JOIN 实现多行常量表的高效写法

分区表 RANGE / LIST 分区在时间序列表上的创建模板

SQL 中 JOIN 时 ON 条件写错导致笛卡尔积的常见写法陷阱

SQL 如何实现“增量同步”基于时间戳或版本号的方案

相关标签:

区别聚合函数 sql count Filter postgresql

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：INSERT INTO ... SELECT 从大表复制数据的锁与日志优化下一篇：如何用 NOWAIT / SKIP LOCKED 避免阻塞等待

作者最新文章

iSCSI session 频繁 logout/login 的 timeout / MPIO / queue_depth 配置

2026-01-29 12:00

Apple 在港正式推出新代 AirTag 物品追蹤工具！卖 $249 更强精準寻找，一图分清较前代有何改进

2026-01-29 12:06

DeepSeek提示词设计 DeepSeek提示词创意设计方法

2026-01-29 12:38

大量残留 netns 的 ip netns list | xargs -n1 ip netns delete 脚本

2026-01-29 13:54

Chrome 浏览器官方下载入口在哪？Chrome 浏览器官方下载入口中文

2026-01-29 13:54

window如何本地部署Clawdbot windows安装Clawdbot指南

2026-01-29 14:00

手把手教你使用 Clawdbot 部署telegram助手

2026-01-29 14:04

豆包网页版入口直达步骤豆包网页版怎么用

2026-01-29 14:11

nftables 规则加载成功但流量不匹配的 hook / priority 问题

2026-01-29 14:15

nft list ruleset 不显示新规则的 table / chain / priority 冲突

2026-01-29 14:26

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍：1、Excel，具有强大的计算和数据处理功能；2、SQL，可以进行数据查询、过滤、排序、聚合等操作；3、Python，拥有丰富的数据分析库；4、R，拥有丰富的统计分析库和图形库；5、Tableau，提供了直观易用的用户界面等等。

749

2023.10.12