如何使用字典权重对 Pandas DataFrame 列进行加权求和并添加新列

碧海醫心

发布时间：2026-02-07 22:49:59

678人浏览过

来源于php中文网

原创

如何使用字典权重对 Pandas DataFrame 列进行加权求和并添加新列

本文介绍如何基于字典定义的权重，对 dataframe 中指定列执行逐行加权求和，并将结果作为新列高效添加，避免硬编码计算，提升可维护性与扩展性。

在数据分析中，经常需要根据业务规则为不同指标赋予权重（如篮球统计中得分 pts 权重为 1、篮板 reb 为 1.2、助攻 ast 为 1.5、失误 tov 为 −1），再对各行进行加权求和生成综合评分（如 score）。若手动编写 df['pts'] * 1 + df['reb'] * 1.2 + ...，不仅冗长易错，且权重变更时需多处修改。更优雅的方式是利用 Pandas 内置的 .dot() 方法，结合字典构建权重向量，实现声明式、可配置的加权计算。

核心思路是：将权重字典转换为 pd.Series，其索引对应目标列名；再调用 df[columns].dot(weights)，Pandas 会自动按列名对齐并执行行级点积（即每行各列值 × 对应权重，再求和）。

以下为完整实现示例：

import pandas as pd

# 原始数据
df = pd.DataFrame({
    'id': [1, 2, 3],
    'pts': [25, 20, 9],
    'ast': [8, 14, 7],
    'reb': [1, 4, 9],
    'oth': [5, 6, 7],  # 不参与加权（字典中未定义）
    'tov': [4, 2, 1]
})

# 权重字典：仅对需参与计算的列定义系数
score_dict = {'pts': 1.0, 'reb': 1.2, 'ast': 1.5, 'tov': -1.0}

# 构建权重 Series（关键：索引必须与目标列名完全一致）
weights = pd.Series(score_dict)

# 执行加权求和 → 自动对齐列名，忽略字典中不存在的列（如 'oth'、'id'）
# 注意：只传入字典中出现的列，确保安全对齐
target_cols = list(score_dict.keys())
df['score'] = df[target_cols].dot(weights)

print(df)

输出：

UP简历

基于AI技术的免费在线简历制作工具

下载

   id  pts  ast  reb  oth  tov  score
0   1   25    8    1    5    4   34.2
1   2   20   14    4    6    2   43.8
2   3    9    7    9    7    1   29.3

✅ 优势说明：

健壮对齐：.dot() 严格依据列名（而非位置）匹配权重，即使列顺序变动或存在无关列（如 id、oth）也不影响结果；
零依赖循环：纯向量化运算，性能优于 apply() 或 map()；
高可维护性：权重集中管理在字典中，增删列或调整系数只需修改 score_dict；
天然容错：若某列在 DataFrame 中缺失，.dot() 会报 KeyError，便于早期发现数据异常。

⚠️ 注意事项：

确保 score_dict 的键全部存在于 df.columns 中，否则会引发 KeyError；可预先校验：assert all(k in df.columns for k in score_dict)；
若需支持缺失列默认权重为 0，可改用 df.reindex(columns=list(score_dict.keys()), fill_value=0).dot(weights)；
避免直接对含非数值列（如字符串 ID）的整个 DataFrame 调用 .dot()，务必显式筛选目标数值列。

通过这一方法，你不仅能简洁实现加权评分逻辑，还能为后续接入配置文件（如 YAML/JSON 权重表）或动态策略引擎打下坚实基础。

如何用Python爬取网页数据？

Python爬虫高级技巧解析_防反爬机制突破与应对策略

Python爬虫进阶教程_反爬机制与数据清洗

PythonWeb爬虫反爬策略教程_IP代理与验证码识别案例

Python反爬识别原理_行为分析解析【教程】

相关标签:

js json 编码 app 配置文件 json pandas for 字符串循环 map 数据分析

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何在多进程环境中正确共享和更新嵌套对象的数据下一篇：暂无

作者最新文章

如何优雅地在二维复数数组中找到模最大的复数值（而非仅返回其模长）

2026-02-07 16:36

如何使用 jQuery 基于未选中复选框动态显示/隐藏表格行

2026-02-07 16:36

如何在 Java 应用中为 GridDB 自定义连接端口

2026-02-07 16:49

如何在复杂表达式（如列表推导式）中嵌入 print 语句进行调试

2026-02-07 16:54

Go语言中的生产者-消费者模型：理解无缓冲通道的同步机制

2026-02-07 17:18

如何开通校园一信通卡并绑定

2026-02-07 17:34

高效流式构建与持久化 Polars DataFrame 的最佳实践

2026-02-07 17:58

瑞幸联名三丽鸥什么时候上线

2026-02-07 17:58

Spring 中 Application Scope Bean 的作用域详解

2026-02-07 18:05

如何在 Python 中正确打印 map 对象并实现字符位移加密

2026-02-07 18:09

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章，帮助大家解决问题。

430

2023.08.07

json是什么

JSON是一种轻量级的数据交换格式，具有简洁、易读、跨平台和语言的特点，JSON数据是通过键值对的方式进行组织，其中键是字符串，值可以是字符串、数值、布尔值、数组、对象或者null，在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容，供大家免费下载体验。

542

2023.08.23