groupby怎么按条件分组 groupby高级用法示例【干货】

倫敦的微風

发布时间：2026-02-09 18:18:16

229人浏览过

来源于php中文网

原创

pandas分组五大方法：一、布尔序列分组（True/False二值切分）；二、lambda函数动态键；三、多列交叉组合（MultiIndex）；四、cut/qcut数值区间分组；五、自定义函数+apply复杂逻辑。

groupby怎么按条件分组 groupby高级用法示例【干货】 - php中文网

一、使用布尔序列进行条件分组

通过传入布尔型Series或数组，pandas会将True与False分别作为两个组标签，实现逻辑条件驱动的分组。该方式适用于二值化切分场景，无需预先定义分组键。

1、构造示例DataFrame，包含姓名、年龄和销售额三列数据。

2、生成布尔条件：sales > 5000，得到长度匹配的True/False序列。

3、调用df.groupby(sales > 5000)执行分组，返回GroupBy对象。

4、对分组结果调用agg({'age': 'mean', 'sales': 'sum'})，分别计算各组平均年龄与销售总额。

二、利用lambda函数动态生成分组键

lambda函数可在groupby中即时计算分组依据，支持基于多列组合、数值区间、字符串特征等灵活逻辑，避免显式新增列。

1、对age列使用lambda x: '青年' if x

2、将该lambda函数直接传入groupby()，作为分组键参数。

3、确保lambda作用于单列（如df.groupby(df['age'].apply(...))）或使用df.groupby(df.apply(..., axis=1))处理行级逻辑。

4、后续可链式调用.size()或.agg({'sales': ['min', 'max']})获取聚合结果。

三、按多个列的交叉组合分组（MultiIndex分组）

将多个列名以列表形式传入groupby，可构建层次化分组索引，支持跨维度交叉统计，结果天然具备MultiIndex结构。

1、调用df.groupby(['region', 'product_type'])启动分组。

2、分组后调用.sum()，输出行索引为(region, product_type)双层元组的Series或DataFrame。

SPLASH

将音乐制作的乐趣带给每个人。

下载

3、使用.unstack('product_type')将第二层索引转为列，生成透视风格表格。

4、对特定层级调用.droplevel(0)或.swaplevel()可调整索引顺序，便于后续筛选或重采样。

四、使用cut与qcut实现数值区间分组

cut用于等宽区间划分，qcut用于等频（分位数）区间划分，二者均返回Categorical对象，可直接作为groupby键，适用于连续变量离散化分析。

1、对sales列调用pd.cut(df['sales'], bins=[0, 3000, 7000, float('inf')], labels=['低', '中', '高'])生成区间标签。

2、将返回的Categorical对象传入groupby，例如df.groupby(cut_result)。

3、使用qcut时指定q=4，自动按四分位数切分为4个数量近似相等的组。

4、分组后调用.count()可验证各区间样本量是否均衡，特别注意：qcut对重复极值敏感，建议先drop_duplicates或添加微扰。

五、自定义分组函数配合apply实现复杂逻辑

当分组逻辑无法通过简单映射表达时，可编写返回标量或元组的函数，并配合apply进行逐组处理，实现高度定制化聚合或变换。

1、定义函数def classify_by_ratio(x): return 'A' if x['sales'].sum() / x['cost'].sum() > 1.5 else 'B'。

2、使用df.groupby('region').apply(classify_by_ratio)执行分组并应用函数。

3、若需保留原始索引结构，改用.transform替代.apply；若仅需标量结果，可用.aggregate替代.apply。

4、必须确保函数返回值可哈希且长度为1，否则groupby会抛出ValueError。

相关标签:

pandas Float if count 字符串布尔型 Lambda 对象 transform

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：count和counta有什么区别 count函数用法对比说明【基础】下一篇：count如何配合筛选使用 count统计指定条件数量方法【实战】

作者最新文章

风车动漫网页版入口在哪风车动漫官网电脑端直达

2026-02-09 17:05

PixelBeads网页版入口在哪 PixelBeads官网电脑端直达

2026-02-09 17:05

智学网官网网页版地址智学网最新电脑版登录入口

2026-02-09 17:23

2026春节高速免费几座车免费时段和适用车型汇总【最新】

2026-02-09 17:24

百度地图怎么添加常用地址百度地图快速收藏地点方法【步骤】

2026-02-09 17:31

红果短剧网页版官方入口红果短剧电脑端在线观看官网

2026-02-09 17:31

红果短剧官网入口网址红果短剧PC端正版访问页面

2026-02-09 17:41

京东国补怎么领取最划算京东购物国补申请与抵扣步骤【攻略】

2026-02-09 17:44

虫虫漫画官网入口网址虫虫漫画PC端正版访问页面

2026-02-09 17:44

苹果手机怎么开启深色模式苹果手机深色模式一键设置指南【指南】

2026-02-09 17:48

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧，涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估，以及基于实际业务场景的时间序列项目实操，帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

2025.12.04

Python 数据清洗与预处理实战

本专题系统讲解 Python 在数据清洗与预处理中的核心技术，包括使用 Pandas 进行缺失值处理、异常值检测、数据格式化、特征工程与数据转换，结合 NumPy 高效处理大规模数据。通过实战案例，帮助学习者掌握如何处理混乱、不完整数据，为后续数据分析与机器学习模型训练打下坚实基础。

2026.01.31

css中float用法

css中float属性允许元素脱离文档流并沿其父元素边缘排列，用于创建并排列、对齐文本图像、浮动菜单边栏和重叠元素。想了解更多float的相关内容，可以阅读本专题下面的文章。

582

2024.04.28

C++中int、float和double的区别

本专题整合了c++中int和double的区别，阅读专题下面的文章了解更多详细内容。

104

2025.10.23

if什么意思

if的意思是“如果”的条件。它是一个用于引导条件语句的关键词，用于根据特定条件的真假情况来执行不同的代码块。本专题提供if什么意思的相关文章，供大家免费阅读。

800

2023.08.22

counta和count的区别

Count函数用于计算指定范围内数字的个数，而CountA函数用于计算指定范围内非空单元格的个数。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

198

2023.11.20

js 字符串转数组

js字符串转数组的方法：1、使用“split()”方法；2、使用“Array.from()”方法；3、使用for循环遍历；4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容，供大家免费下载体验。

464

2023.08.03

js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容，供大家免费下载体验。

213

2023.09.04

Golang处理数据库错误教程合集

本专题整合了Golang数据库错误处理方法、技巧、管理策略相关内容，阅读专题下面的文章了解更多详细内容。

130

2026.02.06

热门下载

网站特效

网站源码

网站素材

前端模板