如何为已展开（unstack）的DataFrame添加总计列

聖光之護

发布时间：2026-02-01 15:56:01

650人浏览过

来源于php中文网

原创

如何为已展开（unstack）的DataFrame添加总计列

本文介绍如何在已通过 `unstack()` 转换为宽格式的分组统计 dataframe 中，高效、准确地新增一列用于显示每行的横向合计（即按列求和），并避免因索引错位导致的 nan 问题。

在使用 pandas 进行多维度频数分析时，常通过 groupby().size().unstack() 将数据转为“行列交叉表”形式（如 churn_label 为列，under_30 为行索引）。此时若需补充每行的总计（即该年龄段下“是/否流失”的总客户数），必须对当前宽表结构直接按行求和，而非对原始分组结果或未对齐的中间结构操作——否则极易因索引不匹配产生全 NaN。

正确做法如下：

# 步骤1：生成规范的宽格式交叉表（推荐用 size() + unstack）
data_df = customer_churn_df.groupby(["under_30", "churn_label"]).size().unstack(fill_value=0)

# 步骤2：沿行方向（axis=1）求和，生成新列；自动对齐索引，无 NaN 风险
data_df["Total"] = data_df.sum(axis=1)

✅ 关键说明：

使用 .size()（而非 .count()）可避免空值干扰，且返回 Series 更利于后续 unstack；
fill_value=0 确保缺失组合（如某 under_30 值下无 Yes 样本）填充为 0，保障求和完整性；
data_df.sum(axis=1) 直接作用于当前 DataFrame，天然保持行索引对齐，彻底规避原代码中 unstack(level=-1).sum() 导致的索引错位问题。

⚠️ 注意事项：

Boba.video

AI动漫视频生成器

下载

切勿在 unstack 后再次调用 unstack 或对已展开结果做复杂索引变换——这会破坏行列结构；
若原始列名含多级索引（如 churn_label 是列名层级），data_df.sum(axis=1) 仍安全有效；
如需重命名列（如将 "Total" 替换为 "total_count"），直接赋值即可：data_df.rename(columns={"Total": "total_count"})。

最终输出即为你所需的结构：

churn_label   No  Yes  Total
under_30                 
No          4077 1564   5641
Yes         1097  304   1401

（注：示例数值基于逻辑推算，实际以你的数据为准）

相关标签:

pandas count

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何在 Python 中使用正则表达式精准替换独立的单词 "sid" 下一篇：如何使用 Pandas 字典映射动态为日期列添加天数偏移

作者最新文章

HK2 服务注入失效的根源与正确配置方法

2026-03-18 09:06

如何在PHP动态引入HTML后用JavaScript正确操作DOM元素

2026-03-18 09:16

《乐高蝙蝠侠：黑暗骑士之遗》提前至5月22日发售

2026-03-18 09:22

如何教孩子唱贝瓦儿歌

2026-03-18 10:00

WooCommerce 自定义字段验证：仅对启用该字段的商品执行上传必填校验

2026-03-18 10:02

via浏览器如何添加标签

2026-03-18 10:04

Spring 单元测试中正确注入 MapStruct Mapper 的完整指南

2026-03-18 10:11

Listen1如何显示桌面歌词

2026-03-18 10:14

如何在 PHP 中安全嵌入含多重引号的 Excel 公式 SQL 查询

2026-03-18 10:27

字符串中按序替换双花括号占位符（如 {{1}}）为数组对应元素的完整实现指南

2026-03-18 10:28

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧，涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估，以及基于实际业务场景的时间序列项目实操，帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

2025.12.04

Python 数据清洗与预处理实战

本专题系统讲解 Python 在数据清洗与预处理中的核心技术，包括使用 Pandas 进行缺失值处理、异常值检测、数据格式化、特征工程与数据转换，结合 NumPy 高效处理大规模数据。通过实战案例，帮助学习者掌握如何处理混乱、不完整数据，为后续数据分析与机器学习模型训练打下坚实基础。

2026.01.31

counta和count的区别

Count函数用于计算指定范围内数字的个数，而CountA函数用于计算指定范围内非空单元格的个数。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

203

2023.11.20

Python WebSocket实时通信与异步服务开发实践

本专题聚焦 Python 在实时通信场景中的开发实践，系统讲解 WebSocket 协议原理、长连接管理、消息推送机制以及异步服务架构设计。内容包括客户端与服务端通信实现、连接稳定性优化、消息队列集成及高并发处理策略。通过完整案例，帮助开发者构建高效稳定的实时通信系统，适用于聊天应用、实时数据推送等场景。

2026.03.18