如何基于自定义迭代序号对多个 DataFrame 进行精准横向拼接

花韻仙語

发布时间：2026-02-12 11:56:55

471人浏览过

来源于php中文网

原创

如何基于自定义迭代序号对多个 DataFrame 进行精准横向拼接

本文介绍如何使用 pandas 按指定 iteration 列值（如 '1_1', '2_2'）分别从不同 dataframe 中提取对应行，并沿列方向（axis=1）合并为结构对齐的新表，适用于性能测试数据比对等场景。

在性能分析或实验对比中，常需从多个独立采集的 DataFrame 中提取特定迭代（iteration）批次的数据进行横向并排比对——例如将基准组 df1 的 ['1_1', '2_2', '3_3', '9_9'] 行与对照组 df2 的 ['1_1', '2_2', '5_5', '6_6'] 行按顺序左右拼接，形成双栏对照表。这种需求无法通过常规 merge 或 concat(..., axis=0) 实现，关键在于保持用户指定的行序，而非默认索引或自然顺序。

核心思路是：先将各 DataFrame 以 'iteration' 列设为索引，再用 reindex() 按目标列表强制重排（缺失值自动填充为 NaN），最后通过 pd.concat(..., axis=1) 横向拼接。该方法确保左右两栏的第 i 行严格对应各自列表中的第 i 个 iteration 值。

以下是完整实现代码：

import pandas as pd

def align_by_iteration(df, target_iterations):
    """
    根据指定 iteration 值列表对 DataFrame 进行对齐重排
    参数:
        df: 输入 DataFrame，必须包含 'iteration' 列
        target_iterations: 字符串列表，如 ['1_1', '2_2', '5_5']
    返回:
        重排后的 DataFrame，行顺序与 target_iterations 严格一致
    """
    return (df.set_index('iteration')
              .reindex(target_iterations)
              .reset_index())

# 示例数据（已按题设构造）
df1 = pd.DataFrame({
    'iteration': ['1_1', '2_2', '3_3', '4_4', '5_5', '6_6', '7_7', '8_8', '9_9'],
    'IOPS': [46090, 12, 49164, 98311, 196604, 249843, 298974, 348108, 397230],
    'Latency': [0.7300, 0.0221, 0.1236, 0.1318, 0.2076, 0.1467, 0.1578, 0.1604, 0.1707]
})

df2 = pd.DataFrame({
    'iteration': ['1_1', '2_2', '3_3', '4_4', '5_5', '6_6'],
    'IOPS': [46074, 12, 49159, 98307, 298976, 397265],
    'Latency': [0.6977, 0.0279, 0.1921, 0.2189, 0.2337, 0.2622]
})

# 指定每张表需提取的 iteration 序列（长度可不等，但 concat 后取最短长度）
df1_iters = ['1_1', '2_2', '3_3', '9_9']
df2_iters = ['1_1', '2_2', '5_5', '6_6']

# 执行对齐 + 横向拼接
df3 = pd.concat([
    align_by_iteration(df1, df1_iters),
    align_by_iteration(df2, df2_iters)
], axis=1)

print(df3)

输出结果如下（列名自动保留，行严格按输入列表顺序对齐）：

飞桨PaddlePaddle

飞桨PaddlePaddle开发者社区与布道，与社区共同进步

下载

  iteration    IOPS  Latency iteration    IOPS  Latency
0       1_1   46090   0.7300       1_1   46074   0.6977
1       2_2      12   0.0221       2_2      12   0.0279
2       3_3   49164   0.1236       5_5  298976   0.2337
3       9_9  397230   0.1707       6_6  397265   0.2622

✅ 关键注意事项：

reindex() 会严格遵循目标列表顺序，若某 iteration 在原 DataFrame 中不存在，则对应行全列为 NaN；
pd.concat(..., axis=1) 默认按行索引对齐，而 reindex() 后所有 DataFrame 共享相同整数索引（0, 1, 2, ...），因此能精准逐行拼接；
若需处理更多 DataFrame，推荐使用 itertools.starmap 批量调用 align_by_iteration，提升可维护性（见扩展示例）；
列名重复时（如两表均有 'iteration'），concat 会自动保留原始列名，无需额外重命名——这正是本例所需行为。

该方法轻量、可控、无副作用，是实现“按需抽样+横向比对”任务的标准实践方案。

相关标签:

pandas

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何通过单个按钮同时执行两个带参数的函数调用下一篇：暂无

作者最新文章

Selenium 与 Froxy 代理集成的正确配置方法

2026-02-10 16:20

html5如何画一个三角形

2026-02-10 16:21

九牧之野如何配将阵容最强阵容搭配攻略

2026-02-10 16:27

Web3j Solidity 代码生成后编译失败的解决方案

2026-02-10 16:45

如何让程序在用户输入无效命令时重复提示而非退出

2026-02-10 17:01

被取消的《指环王》MMO游戏截图泄露！《古墓丽影》团队制作

2026-02-10 17:23

战火勋章平民最强阵容一览表战火勋章平民强力搭配

2026-02-10 17:30

html背景图片如何只显示一张图片大小

2026-02-10 17:30

如何提取 DataFrame 中末尾连续同号段（含零过渡）的所有行

2026-02-10 17:43

乱斗西游2平民最强阵容 0氪金阵容搭配推荐

2026-02-10 17:52

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

AI 图片处理图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧，涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估，以及基于实际业务场景的时间序列项目实操，帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

2025.12.04

Python 数据清洗与预处理实战

本专题系统讲解 Python 在数据清洗与预处理中的核心技术，包括使用 Pandas 进行缺失值处理、异常值检测、数据格式化、特征工程与数据转换，结合 NumPy 高效处理大规模数据。通过实战案例，帮助学习者掌握如何处理混乱、不完整数据，为后续数据分析与机器学习模型训练打下坚实基础。

2026.01.31

2026春节习俗大全

本专题整合了2026春节习俗大全，阅读专题下面的文章了解更多详细内容。

186

2026.02.11

Yandex网页版官方入口使用指南_国际版与俄罗斯版访问方法解析

本专题全面整理了Yandex搜索引擎的官方入口信息，涵盖国际版与俄罗斯版官网访问方式、网页版直达入口及免登录使用说明，帮助用户快速、安全地进入Yandex官网，高效使用其搜索与相关服务。

588

2026.02.11

虫虫漫画网页版入口与免费阅读指南_正版漫画全集在线查看方法

本专题系统整理了虫虫漫画官网及网页版最新入口，涵盖免登录观看、正版漫画全集在线阅读方式，并汇总稳定可用的访问渠道，帮助用户快速找到虫虫漫画官方页面，轻松在线阅读各类热门漫画内容。

2026.02.11

Docker容器化部署与DevOps实践

本专题面向后端与运维开发者，系统讲解 Docker 容器化技术在实际项目中的应用。内容涵盖 Docker 镜像构建、容器运行机制、Docker Compose 多服务编排，以及在 DevOps 流程中的持续集成与持续部署实践。通过真实场景演示，帮助开发者实现应用的快速部署、环境一致性与运维自动化。

2026.02.11

Rust异步编程与Tokio运行时实战

本专题聚焦 Rust 语言的异步编程模型，深入讲解 async/await 机制与 Tokio 运行时的核心原理。内容包括异步任务调度、Future 执行模型、并发安全、网络 IO 编程以及高并发场景下的性能优化。通过实战示例，帮助开发者使用 Rust 构建高性能、低延迟的后端服务与网络应用。

2026.02.11

Spring Boot企业级开发与MyBatis Plus实战

本专题面向 Java 后端开发者，系统讲解如何基于 Spring Boot 与 MyBatis Plus 构建高效、规范的企业级应用。内容涵盖项目架构设计、数据访问层封装、通用 CRUD 实现、分页与条件查询、代码生成器以及常见性能优化方案。通过完整实战案例，帮助开发者提升后端开发效率，减少重复代码，快速交付稳定可维护的业务系统。

2026.02.11

包子漫画网页版入口与全集阅读指南_正版免费漫画快速访问方法

本专题汇总了包子漫画官网和网页版入口，提供最新章节抢先看方法、正版免费阅读指南，以及稳定访问方式，帮助用户快速直达包子漫画页面，无广告畅享全集漫画内容。

205

2026.02.10

热门下载

网站特效

网站源码

网站素材

前端模板