使用Python循环批量更新Excel中按分组汇总的列值

霞舞

发布时间：2026-02-18 21:59:00

590人浏览过

来源于php中文网

原创

使用Python循环批量更新Excel中按分组汇总的列值

本文介绍如何利用pandas高效实现excel数据的分组求和并回填至原表——无需显式for循环，仅用一行transform('sum')即可完成按“age”分组累加“income”并自动填充至“total”列。

本文介绍如何利用pandas高效实现excel数据的分组求和并回填至原表——无需显式for循环，仅用一行transform('sum')即可完成按“age”分组累加“income”并自动填充至“total”列。

在实际数据分析与报表自动化场景中，常需将原始Excel表格中某列（如INCOME）按另一列（如AGE）分组汇总，并将结果回填到同一张表的新列（如Total）中。传统做法可能尝试iterrows()或嵌套循环，不仅代码冗长、性能低下，还极易因索引错位导致填充错误。而Pandas提供了更优雅、向量化且鲁棒的解决方案。

核心方法：groupby().transform()

transform() 是 Pandas 中专为“分组后广播回原形状”设计的方法——它确保输出结果与原始DataFrame行数完全一致，完美适配“原地填充”需求。相比 agg()（返回缩减后的结果）或 apply()（需手动对齐），transform 是本任务的最优解。

以下为完整可执行流程：

Lenso.ai

AI反向图像搜索

下载

import pandas as pd

# 1. 读取Excel文件（假设文件名为 'data.xlsx'，数据在默认sheet）
df = pd.read_excel('data.xlsx')

# 2. 确保数值列格式正确（处理可能存在的千分位逗号，如 '50,000' → 50000）
df['INCOME'] = df['INCOME'].astype(str).str.replace(',', '').astype(float)

# 3. 按 'AGE' 分组，对 'INCOME' 求和，并广播回每行
df['Total'] = df.groupby('AGE')['INCOME'].transform('sum')

# 4. 将结果写回Excel（覆盖原表或另存为新文件）
df.to_excel('data_updated.xlsx', index=False)

运行后，原始数据将被更新为：

立即学习“Python免费学习笔记（深入）”；

AGE	INCOME	Total
32	50000	141000
34	55000	93000
32	43000	141000
32	48000	141000
34	38000	93000

关键注意事项

✅ 数据清洗不可省略：若INCOME含逗号、货币符号或空格，必须先标准化为数值类型，否则groupby().sum()会报错或返回NaN；
✅ transform 保证对齐：即使分组内行数不均（如AGE=32有3行、AGE=34有2行），结果仍严格按原顺序逐行填充，无索引风险；
⚠️ 避免使用 iterrows() 或 for i in range(len(df))：这类显式循环在Pandas中效率极低，且易引入SettingWithCopyWarning等赋值警告；
? 扩展提示：除 'sum' 外，transform 同样支持 'mean'、'count'、'max' 等聚合函数，亦可传入自定义lambda函数，例如：
df['AvgIncomeByAge'] = df.groupby('AGE')['INCOME'].transform(lambda x: x.mean().round(2))

掌握 groupby().transform() 不仅能高效解决本例中的分组汇总回填问题，更是构建可维护、高性能数据处理流水线的关键能力。

使用 Python 通过 xlwings 实现 Excel 单元格级读写操作

Python 中使用 xlwings 实现 Excel 单元格级读写操作

如何将Excel多个工作表按学号合并为宽表结构

如何将多个 DataFrame 导出到同一个 Excel 文件的不同工作表中

如何使用 Python 在 Excel 保持打开状态下清空并重写指定列数据

相关标签:

excel python pandas count for 循环 Lambda 值类型 len transform 自动化 excel 数据分析

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何在 Telegram Bot 重启后自动发送通知消息下一篇：用多层感知机（MLP）学习两个数的加法：从训练到推理的完整实践

作者最新文章

《轮回之兽》正在进行最后的打磨带来最好体验

2026-02-18 13:22

Java中实现列表间循环减法直至归零的完整教程

2026-02-18 13:28

Go 中全局数据库连接变量的正确声明与跨文件使用方法

2026-02-18 13:29

彩虹主题壁纸如何清理缓存

2026-02-18 13:38

如何在 Go Web 服务中解析并验证 HTTP Basic Auth 凭据

2026-02-18 13:45

塔读小说怎么查看自己的收益

2026-02-18 13:57

Fastify WebSocket 连接在 HTTPS 下失败的解决方案

2026-02-18 14:06

PHP 数据库插入后字段为空的常见原因与修复方案

2026-02-18 14:25

Flexbox 中 textarea 导致意外滚动条的成因与解决方案

2026-02-18 14:55

Go 模板中 {{range .}} 重复渲染问题的根源与正确数据结构设计

2026-02-18 15:05

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

AI 图片处理图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧，涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估，以及基于实际业务场景的时间序列项目实操，帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

2025.12.04

Python 数据清洗与预处理实战

本专题系统讲解 Python 在数据清洗与预处理中的核心技术，包括使用 Pandas 进行缺失值处理、异常值检测、数据格式化、特征工程与数据转换，结合 NumPy 高效处理大规模数据。通过实战案例，帮助学习者掌握如何处理混乱、不完整数据，为后续数据分析与机器学习模型训练打下坚实基础。

2026.01.31

counta和count的区别

Count函数用于计算指定范围内数字的个数，而CountA函数用于计算指定范围内非空单元格的个数。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

199

2023.11.20

lambda表达式

Lambda表达式是一种匿名函数的简洁表示方式，它可以在需要函数作为参数的地方使用，并提供了一种更简洁、更灵活的编码方式，其语法为“lambda 参数列表: 表达式”，参数列表是函数的参数，可以包含一个或多个参数，用逗号分隔，表达式是函数的执行体，用于定义函数的具体操作。本专题为大家提供lambda表达式相关的文章、下载、课程内容，供大家免费下载体验。

212

2023.09.15