0

0

Pandas DataFrame: 基于最近时间戳合并数据

碧海醫心

碧海醫心

发布时间:2025-09-11 22:22:01

|

247人浏览过

|

来源于php中文网

原创

pandas dataframe: 基于最近时间戳合并数据

本文档旨在提供一个清晰的教程,指导读者如何使用 Pandas 库中的 merge_asof 函数,根据最近的时间戳将两个 DataFrame 中的数据进行合并。通过示例代码和详细解释,读者将学会如何处理时间序列数据,并根据时间邻近性进行数据关联。本文涵盖了将时间戳设置为索引以及保留时间戳列的两种合并方式,并展示了如何选择性地合并特定列。

使用 merge_asof 基于最近时间戳合并 Pandas DataFrames

在处理时间序列数据时,经常需要将两个 DataFrame 基于时间戳进行合并。然而,两个 DataFrame 中的时间戳可能并不完全匹配。Pandas 提供了 merge_asof 函数,可以根据最近的时间戳将两个 DataFrame 中的数据进行合并,即使时间戳不完全相同。

准备工作

首先,确保你已经安装了 Pandas 库。如果没有安装,可以使用 pip 进行安装:

pip install pandas

接下来,导入 Pandas 库:

import pandas as pd

示例数据

为了演示 merge_asof 的用法,我们创建两个示例 DataFrame:

df1 = pd.DataFrame({'Time1': ['2023-11-30 13:01:51.813', 
                              '2023-11-28 10:01:51.760', 
                              '2023-11-28 10:01:51.347', 
                              '2023-11-27 10:01:51.320', 
                              '2023-11-26 10:01:51.260'], 
                    'Data1': [2, 4, 6, 8, 10]})

df2 = pd.DataFrame({'Time2': ['2023-11-30 10:00:03.733', 
                              '2023-11-29 08:00:03.767', 
                              '2023-11-28 16:00:03.523', 
                              '2023-11-27 14:00:03.827', 
                              '2023-11-26 12:00:03.417'], 
                    'Data2': ['A', 'B', 'C', 'D', 'E']})

# 将时间字符串转换为 datetime 对象
df1['Time1'] = pd.to_datetime(df1['Time1'], format='%Y-%m-%d %H:%M:%S.%f')
df2['Time2'] = pd.to_datetime(df2['Time2'], format='%Y-%m-%d %H:%M:%S.%f')

# 按照时间戳排序
df1 = df1.sort_values(by=['Time1'])
df2 = df2.sort_values(by=['Time2'])

方法一:将时间戳设置为索引

第一种方法是将时间戳列设置为 DataFrame 的索引,然后使用 merge_asof 进行合并:

# 将时间戳设置为索引
df1 = df1.set_index('Time1')
df2 = df2.set_index('Time2')

# 使用 merge_asof 合并 DataFrame
df3 = pd.merge_asof(left=df1, right=df2, right_index=True, left_index=True, direction='nearest')

print(df3)

这段代码首先将 Time1 和 Time2 列分别设置为 df1 和 df2 的索引。然后,使用 merge_asof 函数进行合并。right_index=True 和 left_index=True 参数指定使用索引进行合并。direction='nearest' 参数指定使用最近的时间戳进行匹配。

输出结果如下:

TeemIp - IPAM and DDI solution
TeemIp - IPAM and DDI solution

TeemIp是一个免费、开源、基于WEB的IP地址管理(IPAM)工具,提供全面的IP管理功能。它允许您管理IPv4、IPv6和DNS空间:跟踪用户请求,发现和分配IP,管理您的IP计划、子网空间、区域和DNS记录,符合最佳的DDI实践。同时,TeemIp的配置管理数据库(CMDB)允许您管理您的IT库存并将您的配置项(CIs)与它们使用的IP关联起来。项目源代码位于https://github.com/TeemIP

下载
                         Data1 Data2
Time1                               
2023-11-26 10:01:51.260     10     E
2023-11-27 10:01:51.320      8     D
2023-11-28 10:01:51.347      6     C
2023-11-28 10:01:51.760      4     C
2023-11-30 13:01:51.813      2     A

方法二:保留时间戳列

第二种方法是不将时间戳列设置为索引,而是使用 left_on 和 right_on 参数指定用于合并的列:

# 使用 merge_asof 合并 DataFrame,保留时间戳列
df3 = pd.merge_asof(left=df1, right=df2, left_on='Time1', right_on='Time2', direction='nearest')

print(df3)

这段代码使用 left_on='Time1' 和 right_on='Time2' 参数指定用于合并的列。direction='nearest' 参数同样指定使用最近的时间戳进行匹配。

输出结果如下:

                    Time1  Data1                   Time2 Data2
0 2023-11-26 10:01:51.260     10 2023-11-26 12:00:03.417     E
1 2023-11-27 10:01:51.320      8 2023-11-27 14:00:03.827     D
2 2023-11-28 10:01:51.347      6 2023-11-28 16:00:03.523     C
3 2023-11-28 10:01:51.760      4 2023-11-28 16:00:03.523     C
4 2023-11-30 13:01:51.813      2 2023-11-30 10:00:03.733     A

选择性合并特定列

如果只需要合并 DataFrame 中的特定列,可以在 merge_asof 函数中使用列选择:

# 选择性合并特定列
df3 = pd.merge_asof(left=df1[['Time1', 'Data1']], right=df2[['Time2', 'Data2']], left_on='Time1', right_on='Time2', direction='nearest')

print(df3)

这段代码只选择了 df1 中的 Time1 和 Data1 列,以及 df2 中的 Time2 和 Data2 列进行合并。

direction 参数详解

direction 参数控制着匹配的方向,它有以下几个可选值:

  • 'backward':使用小于等于 left DataFrame 时间戳的最近 right DataFrame 时间戳。
  • 'forward':使用大于等于 left DataFrame 时间戳的最近 right DataFrame 时间戳。
  • 'nearest':使用最近的 right DataFrame 时间戳,无论其大于还是小于 left DataFrame 的时间戳。

注意事项

  • 在进行 merge_asof 操作之前,确保两个 DataFrame 已经按照时间戳列进行了排序。
  • merge_asof 函数要求时间戳列必须是数值类型或 datetime 类型。如果时间戳列是字符串类型,需要先将其转换为 datetime 类型。
  • 理解 direction 参数的含义,根据实际需求选择合适的匹配方向。

总结

merge_asof 函数是 Pandas 中一个强大的工具,可以方便地根据最近的时间戳将两个 DataFrame 中的数据进行合并。通过本文的教程,你应该已经掌握了 merge_asof 函数的基本用法,并能够灵活地应用于实际数据处理中。无论是将时间戳设置为索引,还是保留时间戳列,亦或是选择性合并特定列,都可以通过 merge_asof 函数轻松实现。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
Python 时间序列分析与预测
Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧,涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估,以及基于实际业务场景的时间序列项目实操,帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

69

2025.12.04

pip安装使用方法
pip安装使用方法

安装步骤:1、确保Python已经正确安装在您的计算机上;2、下载“get-pip.py”脚本;3、按下Win + R键,然后输入cmd并按下Enter键来打开命令行窗口;4、在命令行窗口中,使用cd命令切换到“get-pip.py”所在的目录;5、执行安装命令;6、验证安装结果即可。大家可以访问本专题下的文章,了解pip安装使用方法的更多内容。

339

2023.10.09

更新pip版本
更新pip版本

更新pip版本方法有使用pip自身更新、使用操作系统自带的包管理工具、使用python包管理工具、手动安装最新版本。想了解更多相关的内容,请阅读专题下面的文章。

416

2024.12.20

pip设置清华源
pip设置清华源

设置方法:1、打开终端或命令提示符窗口;2、运行“touch ~/.pip/pip.conf”命令创建一个名为pip的配置文件;3、打开pip.conf文件,然后添加“[global];index-url = https://pypi.tuna.tsinghua.edu.cn/simple”内容,这将把pip的镜像源设置为清华大学的镜像源;4、保存并关闭文件即可。

761

2024.12.23

python升级pip
python升级pip

本专题整合了python升级pip相关教程,阅读下面的文章了解更多详细内容。

349

2025.07.23

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

320

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

212

2023.09.04

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1502

2023.10.24

C++ 设计模式与软件架构
C++ 设计模式与软件架构

本专题深入讲解 C++ 中的常见设计模式与架构优化,包括单例模式、工厂模式、观察者模式、策略模式、命令模式等,结合实际案例展示如何在 C++ 项目中应用这些模式提升代码可维护性与扩展性。通过案例分析,帮助开发者掌握 如何运用设计模式构建高质量的软件架构,提升系统的灵活性与可扩展性。

14

2026.01.30

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
React 教程
React 教程

共58课时 | 4.3万人学习

Pandas 教程
Pandas 教程

共15课时 | 1.0万人学习

ASP 教程
ASP 教程

共34课时 | 4.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号