0

0

如何将 DataFrame 转置并导出为 Excel 文件

心靈之曲

心靈之曲

发布时间:2026-01-15 17:12:10

|

424人浏览过

|

来源于php中文网

原创

如何将 DataFrame 转置并导出为 Excel 文件

本文详解如何正确转置 pandas dataframe 并保存为 excel,解决因 `pivot(index=none)` 引发的 keyerror,并提供两种简洁、健壮的转置方案。

在将 Word 文档中提取的键值对(如候选人信息)结构化为 DataFrame 后,常需以「关键词为列名、对应值为单行数据」的形式导出 Excel——即实现行转列(转置)。原代码中使用 df.pivot(index=None, columns='Keyword', values='Value') 是错误的:pivot() 的 index 参数不可为 None,它要求明确的索引列(或生成唯一行标识),否则会触发 KeyError: None。

✅ 正确且推荐的做法是:先将 'Keyword' 设为索引,再调用 .T(等价于 .transpose())。该方式逻辑清晰、性能高效,且天然支持关键词去重与顺序保持:

拍我AI
拍我AI

AI视频生成平台PixVerse的国内版本

下载
def generate_excel_from_data(data, selected_keys, output_file):
    df = pd.DataFrame(data, columns=['Keyword', 'Value'])
    # 过滤并去重:确保每个关键词只保留首个匹配值(避免重复关键词导致转置失败)
    filtered_df = df[df['Keyword'].isin(selected_keys)].drop_duplicates(subset='Keyword', keep='first')

    # ✅ 正确转置:设 Keyword 为索引 → 转置 → 重置列名为默认整数索引(可选)
    transposed_df = filtered_df.set_index('Keyword').T.reset_index(drop=True)

    # 导出为 Excel(不保存行索引,列名即为原始 Keyword)
    transposed_df.to_excel(output_file, index=False)

⚠️ 注意事项:

  • 去重至关重要:若 Word 中同一关键词(如 'Candidate name')出现多次,set_index('Keyword') 会因重复索引报错。drop_duplicates(..., keep='first') 可安全保留首次提取结果。
  • .T vs .transpose():二者完全等价,.T 更简洁;但 .T 不接受参数,而 .transpose() 支持 copy= 等选项(通常无需)。
  • 避免 .pivot() 误用:pivot() 适用于“长表→宽表”聚合场景(如多行同 keyword 需 agg),此处仅为简单行列互换,set_index().T 是语义最匹配、开销最小的解法。
  • Excel 列顺序:selected_keys 的顺序决定了 Excel 中列的排列。若需严格保序,可在过滤后按 selected_keys 重排列:
    transposed_df = transposed_df[selected_keys]  # 确保列顺序与 desired keys 一致

最终生成的 Excel 将呈现为单行数据,列标题即为 'Candidate name'、'Position applied for' 等关键词,符合 HR 表格标准化需求。此方法稳定、可读性强,适用于任意键值对结构化导出场景。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
Python 时间序列分析与预测
Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧,涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估,以及基于实际业务场景的时间序列项目实操,帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

78

2025.12.04

Python 数据清洗与预处理实战
Python 数据清洗与预处理实战

本专题系统讲解 Python 在数据清洗与预处理中的核心技术,包括使用 Pandas 进行缺失值处理、异常值检测、数据格式化、特征工程与数据转换,结合 NumPy 高效处理大规模数据。通过实战案例,帮助学习者掌握 如何处理混乱、不完整数据,为后续数据分析与机器学习模型训练打下坚实基础。

32

2026.01.31

CSS position定位有几种方式
CSS position定位有几种方式

有4种,分别是静态定位、相对定位、绝对定位和固定定位。更多关于CSS position定位有几种方式的内容,可以访问下面的文章。

83

2023.11.23

excel对比两列数据异同
excel对比两列数据异同

Excel作为数据的小型载体,在日常工作中经常会遇到需要核对两列数据的情况,本专题为大家提供excel对比两列数据异同相关的文章,大家可以免费体验。

1453

2023.07.25

excel重复项筛选标色
excel重复项筛选标色

excel的重复项筛选标色功能使我们能够快速找到和处理数据中的重复值。本专题为大家提供excel重复项筛选标色的相关的文章、下载、课程内容,供大家免费下载体验。

428

2023.07.31

excel复制表格怎么复制出来和原来一样大
excel复制表格怎么复制出来和原来一样大

本专题为大家带来excel复制表格怎么复制出来和原来一样大相关文章,帮助大家解决问题。

572

2023.08.02

excel表格斜线一分为二
excel表格斜线一分为二

在Excel表格中,我们可以使用斜线将单元格一分为二。本专题为大家带来excel表格斜线一分为二怎么弄的相关文章,希望可以帮到大家。

1264

2023.08.02

excel斜线表头一分为二
excel斜线表头一分为二

excel斜线表头一分为二的方法有使用合并单元格功能方法、使用文本框功能方法、使用自定义格式方法。本专题为大家提供excel斜线表头一分为二相关的各种文章、以及下载和课程。

376

2023.08.02

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

3

2026.03.11

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Excel 教程
Excel 教程

共162课时 | 21万人学习

成为PHP架构师-自制PHP框架
成为PHP架构师-自制PHP框架

共28课时 | 2.6万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号