如何使用 Pandas 基于键列高效替换 DataFrame 中的值

霞舞

发布时间：2026-02-07 13:25:51

917人浏览过

来源于php中文网

原创

如何使用 Pandas 基于键列高效替换 DataFrame 中的值

本文介绍如何利用 pandas 的 `map()` 或 `merge()` 方法，根据另一个 dataframe 中的映射关系（如按 `name` 列），批量更新目标 dataframe 中对应字段（如 `value`）的值，适用于 `name` 在源表中非唯一、但在映射表中唯一的典型场景。

在数据清洗与整合任务中，常需用一个“参考表”（如 df2）中的最新/标准值，去覆盖主表（如 df1）中同名字段的旧值。本例中，df1 的 name 列存在重复（如 emma 出现两次），而 df2 的 name 是唯一键，且仅包含部分映射项（emma→2, mark→3），其余行应保持原值不变——这正适合使用 索引映射（map） 方式，简洁、高效且语义清晰。

推荐首选方法：Series.map()（最直观、性能优）

# 构建示例数据
import pandas as pd

df1 = pd.DataFrame({
    'id': [1, 2, 3, 4, 5],
    'country': ['romania', 'russia', 'usa', 'china', 'portugal'],
    'name': ['john', 'emma', 'mark', 'emma', 'nick'],
    'value': [100, 200, 400, 300, 200]
})

df2 = pd.DataFrame({
    'id': [1, 2],
    'name': ['emma', 'mark'],
    'value': [2, 3]
})

# 创建 name → value 的映射字典（自动去重，以 df2 中首次出现为准）
value_map = df2.set_index('name')['value'].to_dict()

# 使用 map 替换 df1 中的 value，未匹配项保留原值（fillna 不必要，map 默认返回 NaN，故用 fillna）
df1['value'] = df1['name'].map(value_map).fillna(df1['value']).astype(df1['value'].dtype)

print(df1)

输出结果完全符合预期：

   id   country  name  value
0   1   romania  john  100.0
1   2    russia  emma    2.0
2   3       usa  mark    3.0
3   4     china  emma    2.0
4   5  portugal  nick  200.0

⚠️ 注意事项：

Face++旷视

Face⁺⁺ AI开放平台

下载

map() 要求映射列（此处为 df2['name']）无重复值，否则 set_index() 会报错；若 df2 中 name 意外重复，可先用 df2.drop_duplicates(subset='name', keep='first') 保证唯一性。
fillna(df1['value']) 确保未在 df2 中找到的 name（如 'john', 'nick'）保留原始 value，避免被置为 NaN。
数据类型兼容性：若原 value 为整型而映射值含小数，fillna 后可能转为 float；如需强整型，最后可加 .astype(int)（需确保无 NaN）。

替代方案：pd.merge() + combine_first()

# 仅选取需更新的列做左连接
df2_subset = df2[['name', 'value']].set_index('name')
df1_indexed = df1.set_index('name')

# 用 df2 的 value 覆盖 df1，其余保留 df1 原值
df1_updated = df1_indexed.combine_first(df2_subset).reset_index()
# 注意：combine_first 会合并所有列，此处仅需更新 value，更稳妥做法是 merge 后选择性赋值

但该方式易引入冗余列或索引混乱，不推荐用于单列替换。若需同时更新多列或做复杂关联，再考虑 merge + 列赋值组合：

merged = df1.merge(df2[['name', 'value']], on='name', how='left', suffixes=('', '_new'))
df1['value'] = merged['value_new'].fillna(merged['value']).astype(df1['value'].dtype)

✅ 总结：对于「按唯一键列替换单列值」这一高频需求，Series.map() 是最 Pythonic、可读性最强且性能最优的选择。它天然契合映射语义，代码简短，逻辑一目了然，应作为默认方案优先采用。

Python中使用threading.Timer调用带参数函数的正确方法

如何用 Python 正则表达式精准提取多行分隔符之间的内容（含换行、去注释）

如何正确向 threading.Timer 的回调函数传递参数

如何在Python中安全处理大文件并持久化读取进度

python如何截取字符串_三种核心方法（切片/find/正则）实战指南

相关标签:

python 数据清洗 pandas 数据类型 Float 整型 int map

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Python 正则表达式多行匹配技巧：精准提取分隔符之间的内容下一篇：暂无

作者最新文章

Chart.js 散点图中实现数据点颜色按 Y 值动态着色

2026-02-06 12:55

业界分析任天堂新发布会传达从复古到3A游戏全揽于旗下野心

2026-02-06 12:57

国产操作系统的崛起：盘点2024年值得关注的国产操作系统

2026-02-06 12:57

如何通过对比新旧数组识别被拖拽移动的元素

2026-02-06 13:16

《最终幻想7》重制版导演：今年将更积极公布游戏开发情报

2026-02-06 14:31

以阵破局，妙算神机！《枪火重生》第七赛季“妙阵天工”正式上线，本体迎来史低特惠！

2026-02-06 14:33

又吃上大份了育碧官方《荣耀战魂》"苦命鸳鸯"整活视频

2026-02-06 14:41

国产化麒麟信安操作系统激活方法

2026-02-06 14:51

恐怖打字游戏《Dyping Escape：生死敲定》2月6日Steam发布免费体验

2026-02-06 15:06

《噬血代码2》登顶Fami通销量榜！超越《马里奥赛车：世界》

2026-02-06 15:25

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧，涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估，以及基于实际业务场景的时间序列项目实操，帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

2025.12.04

Python 数据清洗与预处理实战

本专题系统讲解 Python 在数据清洗与预处理中的核心技术，包括使用 Pandas 进行缺失值处理、异常值检测、数据格式化、特征工程与数据转换，结合 NumPy 高效处理大规模数据。通过实战案例，帮助学习者掌握如何处理混乱、不完整数据，为后续数据分析与机器学习模型训练打下坚实基础。

2026.01.31

数据类型有哪几种

数据类型有整型、浮点型、字符型、字符串型、布尔型、数组、结构体和枚举等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

310

2023.10.31

php数据类型

本专题整合了php数据类型相关内容，阅读专题下面的文章了解更多详细内容。

222

2025.10.31

css中float用法

css中float属性允许元素脱离文档流并沿其父元素边缘排列，用于创建并排列、对齐文本图像、浮动菜单边栏和重叠元素。想了解更多float的相关内容，可以阅读本专题下面的文章。

581

2024.04.28

C++中int、float和double的区别

本专题整合了c++中int和double的区别，阅读专题下面的文章了解更多详细内容。

104

2025.10.23

string转int

在编程中，我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算，或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

606

2023.08.02

int占多少字节

int占4个字节，意味着一个int变量可以存储范围在-2,147,483,648到2,147,483,647之间的整数值，在某些情况下也可能是2个字节或8个字节，int是一种常用的数据类型，用于表示整数，需要根据具体情况选择合适的数据类型，以确保程序的正确性和性能。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

551

2024.08.29