SQL 用户行为分析 SQL 查询案例

冰川箭仙

发布时间：2026-02-18 16:17:44

907人浏览过

来源于php中文网

原创

mysql用户留存率计算需统一日期粒度，避免datetime时分秒干扰；group_concat须调大max_len防截断；会话切分应结合lag与时间差而非仅row_number；漏斗分析宜用exists或独立聚合替代left join以防数据膨胀。

sql 用户行为分析 sql 查询案例

查用户留存率时，`DATE_SUB` 和 `DATE_ADD` 别混用

MySQL 里算次日/7日留存，核心是拿「首日行为日期」和「后续行为日期」做差值。很多人直接写 WHERE event_date = DATE_ADD(first_date, INTERVAL 1 DAY)，但实际 first_date 如果是 DATETIME 类型（比如 '2024-03-01 14:22:05'），DATE_ADD 会保留时分秒，导致等值匹配失败。

正确做法是统一转成日期粒度再比：

用 DATE() 提取日期部分：DATE(event_date) = DATE(DATE_ADD(first_date, INTERVAL 1 DAY))
或更稳妥：先用 MIN(event_date) 算出每个用户的首次行为时间，再用 DATE() 转成 DATE 类型存为 first_active_day，后续所有比较都基于这个字段
注意 DATE_SUB(NOW(), INTERVAL 7 DAY) 返回的是带时分秒的 DATETIME，如果表里 event_date 是 DATE 类型，隐式转换可能走全表扫描

用户路径分析卡在 `GROUP_CONCAT` 长度截断

用 GROUP_CONCAT 拼用户点击序列（比如 'home>search>product>cart'）很常见，但默认长度上限是 1024 字符，超长就 silently 截断——你根本看不出哪条路径被砍了。

必须显式调大：

查当前设置：SELECT @@group_concat_max_len
临时改（当前 session）：SET SESSION group_concat_max_len = 1000000
永久改需在 MySQL 配置文件加 group_concat_max_len = 1000000，重启生效
如果路径节点太多（比如 >50 步），拼字符串本身性能差，建议改用窗口函数 + 递归 CTE 或导出后用 Python 处理

`ROW_NUMBER()` 在用户会话切分时漏掉并发行为

按用户 ID + 时间排序打序号来识别会话（比如 30 分钟无操作算新会话），常用 ROW_NUMBER() OVER (PARTITION BY user_id ORDER BY event_time)。但它只保证顺序，不处理时间间隔逻辑。

真正要切会话，得结合 LAG() 计算上一次行为的时间差：

我的小书坊源码(三层实现)

可以实现用户的在线注册、登陆后可以添加图书、购买图书，可以对图书类别、出版社、价格等进行饼图分析默认帐号/密码：51aspx/51aspx该系统采用三层接口开发，App_Code下为三层结构的代码文件，适合三层入门者学习使用数据绑定控件使用的是GridView，顶部公用文件采用了UserControl用户控件调用DB_51aspx下为Sql数据库文件，附件即可【该源码由51aspx提供】

下载

先用 LAG(event_time) OVER (PARTITION BY user_id ORDER BY event_time) 取前一行时间
再用 CASE WHEN TIMESTAMPDIFF(MINUTE, prev_time, event_time) > 30 THEN 1 ELSE 0 END 标记新会话起点
最后用累计求和（SUM(is_new_session) OVER (PARTITION BY user_id ORDER BY event_time)）生成会话 ID
别直接用 ROW_NUMBER() 当会话 ID——它对同一秒内多个事件无法区分先后，且不感知业务定义的“空闲阈值”

漏斗分析中 `LEFT JOIN` 导致用户数虚高

写四步漏斗（曝光→点击→加购→下单）时，习惯性用 LEFT JOIN 连四张子查询，结果发现第二步用户数比第一步还多。问题出在：没去重，也没限制关联条件唯一性。

典型错误是这样：

SELECT COUNT(DISTINCT a.user_id) AS step1,
       COUNT(DISTINCT b.user_id) AS step2
FROM exposure a
LEFT JOIN click b ON a.user_id = b.user_id

如果一个用户在 a 表出现 1 次、在 b 表出现 5 次，LEFT JOIN 会生成 5 行，COUNT(DISTINCT b.user_id) 虽然仍是 1，但中间膨胀的数据量会让执行变慢，且一旦加了其他过滤条件（比如时间范围不一致），就容易误算。

更稳的做法：

每步单独聚合：SELECT user_id FROM click WHERE event_time >= '2024-03-01' GROUP BY user_id
用 EXISTS 或 IN 做包含判断，而不是 JOIN
如果真要用 JOIN，确保关联字段在子查询里已 DISTINCT 或加 GROUP BY，避免笛卡尔积

漏斗数字失真的地方，往往不在逻辑，而在 JOIN 时没意识到数据已经重复了。

相关标签:

sql mysql count select date Session 字符串递归并发事件

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：SQL 子查询使用方法与优化策略下一篇：暂无

作者最新文章

GitHub 怎么运行别人的代码？GitHub 项目运行完整流程讲解

2026-02-16 12:41

扫描全能王怎么下载pdf文件_扫描全能王文档导出PDF教程

2026-02-16 12:49

Python 闰秒处理的正确姿势

2026-02-16 12:55

微信电脑怎么登录没有手机微信电脑无手机登录方法

2026-02-16 13:13

浏览器f12开发者工具使用教程元素审查、Network抓包与Console调试入门

2026-02-16 13:20

Linux 源列表管理与优化策略

2026-02-16 13:42

edge浏览器同步历史记录同步范围与隐私选项说明

2026-02-16 13:52

Python mock 过度使用的问题分析

2026-02-16 13:59

SQL XA 分布式事务的二阶段提交与单机事务性能代价权衡

2026-02-16 14:05

Linux chmod、chown、chgrp 使用技巧

2026-02-16 14:21

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

AI 图片处理图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍：1、Excel，具有强大的计算和数据处理功能；2、SQL，可以进行数据查询、过滤、排序、聚合等操作；3、Python，拥有丰富的数据分析库；4、R，拥有丰富的统计分析库和图形库；5、Tableau，提供了直观易用的用户界面等等。

985

2023.10.12