0

0

Pandas DataFrame:根据条件匹配多行更新数据

霞舞

霞舞

发布时间:2025-08-28 23:47:01

|

462人浏览过

|

来源于php中文网

原创

pandas dataframe:根据条件匹配多行更新数据

本文介绍了如何使用 Pandas DataFrame 根据条件匹配多行数据并进行更新。核心思路是利用 map() 函数将条件 DataFrame 转换为映射关系,然后使用 update() 函数高效地更新目标 DataFrame 中满足条件的所有行,避免循环操作,提升数据处理效率。

在数据处理过程中,经常会遇到需要根据另一个 DataFrame 中的信息来更新目标 DataFrame 的情况,特别是当多个行满足相同的条件时。 Pandas 提供了多种方法来实现这一目标,但有些方法效率较低,例如循环。本文将介绍一种高效且避免循环的方法,即使用 map() 和 update() 函数相结合来实现批量更新。

实现方法

假设我们有两个 DataFrame,df1 和 df2。df1 中包含需要更新的列(例如 SecurityID),而 df2 包含用于更新的信息。两个 DataFrame 之间通过共同的列(例如 Symbol)建立关联。

我们的目标是,对于 df1 中所有 Symbol 值与 df2 中 Symbol 值相同的行,将 df1 中 SecurityID 的值更新为 df2 中对应的 SecurityID 值。

以下是具体的实现步骤:

  1. 将 df2 转换为映射关系:

    首先,我们需要将 df2 转换为一个映射关系,其中 Symbol 列作为键,SecurityID 列作为值。可以使用 set_index() 函数将 Symbol 列设置为索引,然后选择 SecurityID 列,从而创建一个 Series 对象,该对象本质上就是一个字典。

    mapping = df2.set_index('Symbol')['SecurityID']
  2. 使用 map() 函数进行映射:

    培训招生教育类网站模板(响应式)1.4.2
    培训招生教育类网站模板(响应式)1.4.2

    培训招生教育类网站模板(响应式)安装即用,自带人人站CMS内核,支持响应式,前端banner轮播图文本均已进行可视化配置,伪静态页面生成,支持内容模型、多语言、自定义表单、筛选、多条件搜索等功能,支持多种URL模式及模型。模板特点:1、安装即用,自带人人站CMS内核及企业站展示功能(产品,新闻,案例展示等),并可根据需要增加表单 搜索等功能(自带模板) 2、支持响应式 3、前端banner轮播图文

    下载

    接下来,使用 df1 的 Symbol 列的 map() 函数,将 df1 中的 Symbol 值映射到 mapping 中对应的 SecurityID 值。

    df1['SecurityID'].update(df1['Symbol'].map(mapping))

    map() 函数会将 df1['Symbol'] 中的每个值作为键,在 mapping 中查找对应的值,并将结果返回。

  3. 使用 update() 函数更新 df1:

    最后,我们使用 update() 函数将 df1 中 SecurityID 列的值更新为 map() 函数返回的结果。

完整代码示例

import pandas as pd

# 示例数据
data1 = {'Symbol': ['UGE', 'UGE', 'UGE', 'UGE', 'UGE', 'UGE'],
         'SecurityID': [None, None, None, None, None, None]}
df1 = pd.DataFrame(data1)

data2 = {'Symbol': ['UGE'],
         'SecurityID': [128901]}
df2 = pd.DataFrame(data2)

# 将 df2 转换为映射关系
mapping = df2.set_index('Symbol')['SecurityID']

# 使用 map() 和 update() 函数更新 df1
df1['SecurityID'].update(df1['Symbol'].map(mapping))

# 打印结果
print(df1)

注意事项

  • 确保 df1 和 df2 中用于关联的列(例如 Symbol)的数据类型一致。
  • 如果 df2 中存在多个 Symbol 值相同的行,map() 函数只会返回第一个匹配到的 SecurityID 值。 如果需要更复杂的匹配逻辑,可能需要使用其他方法。
  • update() 函数会直接修改 df1,因此在执行此操作之前,最好备份 df1。

总结

通过 map() 函数将条件 DataFrame 转换为映射关系,然后使用 update() 函数可以高效地更新目标 DataFrame 中满足条件的所有行,避免了循环操作,显著提升了数据处理效率。 这种方法适用于需要根据另一个 DataFrame 中的信息批量更新目标 DataFrame 的情况。

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
Python 时间序列分析与预测
Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧,涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估,以及基于实际业务场景的时间序列项目实操,帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

71

2025.12.04

Python 数据清洗与预处理实战
Python 数据清洗与预处理实战

本专题系统讲解 Python 在数据清洗与预处理中的核心技术,包括使用 Pandas 进行缺失值处理、异常值检测、数据格式化、特征工程与数据转换,结合 NumPy 高效处理大规模数据。通过实战案例,帮助学习者掌握 如何处理混乱、不完整数据,为后续数据分析与机器学习模型训练打下坚实基础。

1

2026.01.31

数据类型有哪几种
数据类型有哪几种

数据类型有整型、浮点型、字符型、字符串型、布尔型、数组、结构体和枚举等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

310

2023.10.31

php数据类型
php数据类型

本专题整合了php数据类型相关内容,阅读专题下面的文章了解更多详细内容。

222

2025.10.31

golang map内存释放
golang map内存释放

本专题整合了golang map内存相关教程,阅读专题下面的文章了解更多相关内容。

75

2025.09.05

golang map相关教程
golang map相关教程

本专题整合了golang map相关教程,阅读专题下面的文章了解更多详细内容。

36

2025.11.16

golang map原理
golang map原理

本专题整合了golang map相关内容,阅读专题下面的文章了解更多详细内容。

61

2025.11.17

java判断map相关教程
java判断map相关教程

本专题整合了java判断map相关教程,阅读专题下面的文章了解更多详细内容。

42

2025.11.27

2026赚钱平台入口大全
2026赚钱平台入口大全

2026年最新赚钱平台入口汇总,涵盖任务众包、内容创作、电商运营、技能变现等多类正规渠道,助你轻松开启副业增收之路。阅读专题下面的文章了解更多详细内容。

54

2026.01.31

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号