0

0

如何使用 Pandas 基于键列高效替换 DataFrame 中的值

霞舞

霞舞

发布时间:2026-02-07 13:25:51

|

917人浏览过

|

来源于php中文网

原创

如何使用 Pandas 基于键列高效替换 DataFrame 中的值

本文介绍如何利用 pandas 的 `map()` 或 `merge()` 方法,根据另一个 dataframe 中的映射关系(如按 `name` 列),批量更新目标 dataframe 中对应字段(如 `value`)的值,适用于 `name` 在源表中非唯一、但在映射表中唯一的典型场景。

数据清洗与整合任务中,常需用一个“参考表”(如 df2)中的最新/标准值,去覆盖主表(如 df1)中同名字段的旧值。本例中,df1 的 name 列存在重复(如 emma 出现两次),而 df2 的 name 是唯一键,且仅包含部分映射项(emma→2, mark→3),其余行应保持原值不变——这正适合使用 索引映射(map) 方式,简洁、高效且语义清晰。

推荐首选方法:Series.map()(最直观、性能优)

# 构建示例数据
import pandas as pd

df1 = pd.DataFrame({
    'id': [1, 2, 3, 4, 5],
    'country': ['romania', 'russia', 'usa', 'china', 'portugal'],
    'name': ['john', 'emma', 'mark', 'emma', 'nick'],
    'value': [100, 200, 400, 300, 200]
})

df2 = pd.DataFrame({
    'id': [1, 2],
    'name': ['emma', 'mark'],
    'value': [2, 3]
})

# 创建 name → value 的映射字典(自动去重,以 df2 中首次出现为准)
value_map = df2.set_index('name')['value'].to_dict()

# 使用 map 替换 df1 中的 value,未匹配项保留原值(fillna 不必要,map 默认返回 NaN,故用 fillna)
df1['value'] = df1['name'].map(value_map).fillna(df1['value']).astype(df1['value'].dtype)

print(df1)

输出结果完全符合预期:

   id   country  name  value
0   1   romania  john  100.0
1   2    russia  emma    2.0
2   3       usa  mark    3.0
3   4     china  emma    2.0
4   5  portugal  nick  200.0

⚠️ 注意事项:

Face++旷视
Face++旷视

Face⁺⁺ AI开放平台

下载
  • map() 要求映射列(此处为 df2['name'])无重复值,否则 set_index() 会报错;若 df2 中 name 意外重复,可先用 df2.drop_duplicates(subset='name', keep='first') 保证唯一性。
  • fillna(df1['value']) 确保未在 df2 中找到的 name(如 'john', 'nick')保留原始 value,避免被置为 NaN。
  • 数据类型兼容性:若原 value 为整型而映射值含小数,fillna 后可能转为 float;如需强整型,最后可加 .astype(int)(需确保无 NaN)。

替代方案:pd.merge() + combine_first()

# 仅选取需更新的列做左连接
df2_subset = df2[['name', 'value']].set_index('name')
df1_indexed = df1.set_index('name')

# 用 df2 的 value 覆盖 df1,其余保留 df1 原值
df1_updated = df1_indexed.combine_first(df2_subset).reset_index()
# 注意:combine_first 会合并所有列,此处仅需更新 value,更稳妥做法是 merge 后选择性赋值

但该方式易引入冗余列或索引混乱,不推荐用于单列替换。若需同时更新多列或做复杂关联,再考虑 merge + 列赋值组合:

merged = df1.merge(df2[['name', 'value']], on='name', how='left', suffixes=('', '_new'))
df1['value'] = merged['value_new'].fillna(merged['value']).astype(df1['value'].dtype)

✅ 总结:对于「按唯一键列替换单列值」这一高频需求,Series.map() 是最 Pythonic、可读性最强且性能最优的选择。它天然契合映射语义,代码简短,逻辑一目了然,应作为默认方案优先采用。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
Python 时间序列分析与预测
Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧,涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估,以及基于实际业务场景的时间序列项目实操,帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

73

2025.12.04

Python 数据清洗与预处理实战
Python 数据清洗与预处理实战

本专题系统讲解 Python 在数据清洗与预处理中的核心技术,包括使用 Pandas 进行缺失值处理、异常值检测、数据格式化、特征工程与数据转换,结合 NumPy 高效处理大规模数据。通过实战案例,帮助学习者掌握 如何处理混乱、不完整数据,为后续数据分析与机器学习模型训练打下坚实基础。

3

2026.01.31

数据类型有哪几种
数据类型有哪几种

数据类型有整型、浮点型、字符型、字符串型、布尔型、数组、结构体和枚举等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

310

2023.10.31

php数据类型
php数据类型

本专题整合了php数据类型相关内容,阅读专题下面的文章了解更多详细内容。

222

2025.10.31

css中float用法
css中float用法

css中float属性允许元素脱离文档流并沿其父元素边缘排列,用于创建并排列、对齐文本图像、浮动菜单边栏和重叠元素。想了解更多float的相关内容,可以阅读本专题下面的文章。

581

2024.04.28

C++中int、float和double的区别
C++中int、float和double的区别

本专题整合了c++中int和double的区别,阅读专题下面的文章了解更多详细内容。

104

2025.10.23

string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

606

2023.08.02

int占多少字节
int占多少字节

int占4个字节,意味着一个int变量可以存储范围在-2,147,483,648到2,147,483,647之间的整数值,在某些情况下也可能是2个字节或8个字节,int是一种常用的数据类型,用于表示整数,需要根据具体情况选择合适的数据类型,以确保程序的正确性和性能。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

551

2024.08.29

Golang处理数据库错误教程合集
Golang处理数据库错误教程合集

本专题整合了Golang数据库错误处理方法、技巧、管理策略相关内容,阅读专题下面的文章了解更多详细内容。

2

2026.02.06

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.4万人学习

Django 教程
Django 教程

共28课时 | 4万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.4万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号