0

0

Pandas 数据合并实战:基于日期与股票代码的跨表价格匹配

霞舞

霞舞

发布时间:2026-01-31 08:48:11

|

441人浏览过

|

来源于php中文网

原创

Pandas 数据合并实战:基于日期与股票代码的跨表价格匹配

本文详解如何将宽格式股价数据(日期为索引、股票为列)与交易记录表(含 date 和 symbol 列)精准关联,通过 stack + merge 实现按日期+股票双重键查找并添加 price 字段。

金融数据分析中,常需将宽格式的价格数据表(如每列为一只股票、索引为交易日)与长格式的交易事件表(如每行为一笔买卖,含 Date、Symbol、Shares 等字段)进行关联,从而为每笔交易补充对应时刻的成交价格。由于两表结构差异大——前者是 DatetimeIndex × StockColumns 的二维矩阵,后者是普通带列名的 DataFrame——直接使用 pd.concat() 或 join() 并不适用;正确做法是先重塑价格表结构,再执行多键合并

✅ 正确步骤:stack → reset_index → merge

假设你已加载两个 DataFrame:

  • df_prices:索引为 DatetimeIndex(如 '2007-01-10', '2007-01-17'),列名为股票代码('SPY', 'AAPL', 'IBM', ...);
  • df_trades:普通 DataFrame,含列 'Date'(字符串或 datetime)、'Symbol'、'Order'、'Shares'。

你需要为 df_trades 中每一行,从 df_prices 中查出 相同日期 + 相同股票 对应的价格,并新增 'Price' 列。

? 核心操作解析

# 1. 将宽表 df_prices 转为长表:每行 = (日期, 股票, 价格)
tmp = df_prices.stack().reset_index(name='Price')
# 结果列:level_0(原索引日期)、level_1(原列名股票)、Price

# 2. 与交易表按日期和股票列合并
result = df_trades.merge(
    tmp,
    left_on=['Date', 'Symbol'],
    right_on=['level_0', 'level_1'],
    how='inner'  # 仅保留有价格匹配的交易
).drop(columns=['level_0', 'level_1'])  # 清理冗余键列
? stack() 是关键:它将列名(股票代码)“压入”行内,生成一个具有 MultiIndex 的 Series;reset_index(name='Price') 则将其展开为标准三列 DataFrame,便于后续 merge。

? 完整可运行示例

import pandas as pd

# 构造示例价格数据(索引为日期)
df_prices = pd.DataFrame({
    'SPY': [126.72, 128.05],
    'AAPL': [96.59, 94.54],
    'IBM': [89.56, 90.58],
    'GOOG': [489.46, 497.28],
    'XOM': [62.47, 63.77],
    'BAC': [46.40, 46.17],
    'GLD': [60.59, 62.64]
}, index=pd.to_datetime(['2007-01-10', '2007-01-17']))

# 构造示例交易数据
df_trades = pd.DataFrame({
    'Date': pd.to_datetime(['2007-01-10', '2007-01-17', '2007-01-19']),
    'Symbol': ['AAPL', 'AAPL', 'IBM'],
    'Order': ['BUY', 'SELL', 'BUY'],
    'Shares': [2500, 1500, 400]
})

# 执行合并
tmp = df_prices.stack().reset_index(name='Price')
result = df_trades.merge(
    tmp,
    left_on=['Date', 'Symbol'],
    right_on=['level_0', 'level_1'],
    how='inner'
).drop(columns=['level_0', 'level_1'])

print(result)

输出结果:

HaiSnap
HaiSnap

一站式AI应用开发和部署工具

下载
        Date Symbol Order  Shares  Price
0 2007-01-10   AAPL   BUY    2500  96.59
1 2007-01-17   AAPL  SELL    1500  94.54

⚠️ 注意:第三笔交易 '2007-01-19' 未出现在 df_prices 中(该表只含前两日),因此被 how='inner' 自动过滤。若需保留所有交易并填充 NaN(如 how='left'),请按需调整。

✅ 替代方案对比(不推荐)

  • ❌ pd.concat(..., axis=1):仅适用于索引完全对齐的横向拼接,无法按 Symbol 动态取值;
  • ❌ df_trades['Price'] = df_prices.lookup(...):lookup 已弃用,且要求索引/列严格匹配,容错性差;
  • ✅ map + apply:虽可行但效率低,尤其大数据量时明显慢于向量化 merge。

✅ 最佳实践建议

  • 始终确保 Date 列类型一致(推荐统一为 datetime64[ns]);
  • 若 df_prices 索引含时区信息,请在 merge 前用 .dt.tz_localize(None) 统一;
  • 合并后建议检查 result['Price'].isna().sum(),确认缺失值是否符合预期;
  • 对大规模数据,可先对 tmp 设置 set_index(['level_0','level_1']) 加速 merge。

掌握 stack + merge 这一组合技,你就能灵活应对各类“宽表→长表→业务主表”的关联需求,真正打通行情数据与交易逻辑之间的最后一公里。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
Python 时间序列分析与预测
Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧,涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估,以及基于实际业务场景的时间序列项目实操,帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

71

2025.12.04

Python 数据清洗与预处理实战
Python 数据清洗与预处理实战

本专题系统讲解 Python 在数据清洗与预处理中的核心技术,包括使用 Pandas 进行缺失值处理、异常值检测、数据格式化、特征工程与数据转换,结合 NumPy 高效处理大规模数据。通过实战案例,帮助学习者掌握 如何处理混乱、不完整数据,为后续数据分析与机器学习模型训练打下坚实基础。

1

2026.01.31

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

320

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

212

2023.09.04

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1503

2023.10.24

字符串介绍
字符串介绍

字符串是一种数据类型,它可以是任何文本,包括字母、数字、符号等。字符串可以由不同的字符组成,例如空格、标点符号、数字等。在编程中,字符串通常用引号括起来,如单引号、双引号或反引号。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

625

2023.11.24

java读取文件转成字符串的方法
java读取文件转成字符串的方法

Java8引入了新的文件I/O API,使用java.nio.file.Files类读取文件内容更加方便。对于较旧版本的Java,可以使用java.io.FileReader和java.io.BufferedReader来读取文件。在这些方法中,你需要将文件路径替换为你的实际文件路径,并且可能需要处理可能的IOException异常。想了解更多java的相关内容,可以阅读本专题下面的文章。

655

2024.03.22

php中定义字符串的方式
php中定义字符串的方式

php中定义字符串的方式:单引号;双引号;heredoc语法等等。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

610

2024.04.29

2026赚钱平台入口大全
2026赚钱平台入口大全

2026年最新赚钱平台入口汇总,涵盖任务众包、内容创作、电商运营、技能变现等多类正规渠道,助你轻松开启副业增收之路。阅读专题下面的文章了解更多详细内容。

8

2026.01.31

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Go 教程
Go 教程

共32课时 | 4.4万人学习

Go语言实战之 GraphQL
Go语言实战之 GraphQL

共10课时 | 0.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号