0

0

Python DataFrame怎么变字典_to_dict()各种 orient 格式对比

P粉602998670

P粉602998670

发布时间:2026-03-15 14:46:34

|

315人浏览过

|

来源于php中文网

原创

orient='dict'返回每列对应一个字典(键为索引、值为单元格),orient='list'返回每列对应一个列表;orient='records'按行转字典列表;orient='index'易因非字符串或重复索引引发KeyError;NaN需手动转None以防JSON序列化失败;大DF中orient='records'性能最差。

python dataframe怎么变字典_to_dict()各种 orient 格式对比

orient='dict' 和 orient='list' 最常用,但含义容易搞反

很多人以为 orient='dict' 是把 DataFrame 变成“字典”,orient='list' 是变成“列表”——其实完全相反:orient='dict' 的结果是每个列对应一个字典(键是索引,值是单元格),而 orient='list' 才是每个列对应一个 Python 列表。

实际用法取决于你后续怎么取数:要按列名快速查某行所有字段?选 orient='records';要按索引查某列所有值?orient='dict' 更直接。

  • orient='dict' → 返回 {'col_a': {0: val1, 1: val2}, 'col_b': {0: val3, 1: val4}}
  • orient='list' → 返回 {'col_a': [val1, val2], 'col_b': [val3, val4]}
  • orient='records' → 返回 [{'col_a': val1, 'col_b': val3}, {'col_a': val2, 'col_b': val4}]

orient='index' 容易报 KeyError,尤其索引不是字符串时

orient='index' 把索引变成外层 key,列名变成内层 key。问题在于:如果原始 DataFrame 索引是整数(比如默认 RangeIndex),转出的字典 key 就是数字,但很多人下意识当字符串用,一查就 KeyError

更隐蔽的是:如果索引含重复值,_to_dict() 不报错,但后出现的行会覆盖前面同索引的值,数据直接丢。

立即学习Python免费学习笔记(深入)”;

灵机语音
灵机语音

灵机语音

下载
  • 检查索引类型:df.index.dtype,非字符串索引建议先 df.index = df.index.astype(str)
  • 检查索引唯一性:df.index.is_unique,不唯一时慎用 orient='index'
  • 示例错误:result[0] 报错?试试 result[0] → 实际可能是 result['0'] 或根本不存在

NaN 值在不同 orient 下表现不一致,JSON 序列化前必须处理

to_dict()NaN 的处理不是统一的:orient='list'orient='records'NaN 变成 None,但 orient='dict' 里仍是 nan(float 类型),这会导致后续 json.dumps() 直接报 TypeError: Object of type float32 is not JSON serializable

别指望 pandas 自动转,它只管结构不管序列化兼容性。

  • 统一转 None:用 df = df.where(pd.notna(df), None) 再调 to_dict()
  • 或用 df.fillna(float('nan')).replace({float('nan'): None}).to_dict(...)
  • 注意:fillna(None) 在某些 pandas 版本中不生效,必须用 wherereplace

大 DataFrame 调用 to_dict() 性能跳变,orient='records' 最慢

同样一个 10 万行 × 10 列的 DataFrame,orient='list' 耗时约 80ms,orient='dict' 约 95ms,但 orient='records' 可能飙到 400ms 以上——因为它是逐行构造 dict,Python 层开销大,且每行都新建 dict 对象。

如果你只是想遍历数据,别急着全量转字典;如果最终要 JSON,df.to_json(orient='records')to_dict().to_json() 快 3–5 倍。

  • 性能排序(快→慢):listdict split index records
  • 内存占用:orient='records' 生成最多新对象,GC 压力明显
  • 替代方案:用 df.itertuples(index=False)df.values.tolist() + 列名 zip,更快更省内存
事情说清了就结束

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
json数据格式
json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章,帮助大家解决问题。

457

2023.08.07

json是什么
json是什么

JSON是一种轻量级的数据交换格式,具有简洁、易读、跨平台和语言的特点,JSON数据是通过键值对的方式进行组织,其中键是字符串,值可以是字符串、数值、布尔值、数组、对象或者null,在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容,供大家免费下载体验。

549

2023.08.23

jquery怎么操作json
jquery怎么操作json

操作的方法有:1、“$.parseJSON(jsonString)”2、“$.getJSON(url, data, success)”;3、“$.each(obj, callback)”;4、“$.ajax()”。更多jquery怎么操作json的详细内容,可以访问本专题下面的文章。

337

2023.10.13

go语言处理json数据方法
go语言处理json数据方法

本专题整合了go语言中处理json数据方法,阅读专题下面的文章了解更多详细内容。

83

2025.09.10

Python 时间序列分析与预测
Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧,涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估,以及基于实际业务场景的时间序列项目实操,帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

82

2025.12.04

Python 数据清洗与预处理实战
Python 数据清洗与预处理实战

本专题系统讲解 Python 在数据清洗与预处理中的核心技术,包括使用 Pandas 进行缺失值处理、异常值检测、数据格式化、特征工程与数据转换,结合 NumPy 高效处理大规模数据。通过实战案例,帮助学习者掌握 如何处理混乱、不完整数据,为后续数据分析与机器学习模型训练打下坚实基础。

34

2026.01.31

css中float用法
css中float用法

css中float属性允许元素脱离文档流并沿其父元素边缘排列,用于创建并排列、对齐文本图像、浮动菜单边栏和重叠元素。想了解更多float的相关内容,可以阅读本专题下面的文章。

595

2024.04.28

C++中int、float和double的区别
C++中int、float和double的区别

本专题整合了c++中int和double的区别,阅读专题下面的文章了解更多详细内容。

108

2025.10.23

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

69

2026.03.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.5万人学习

Django 教程
Django 教程

共28课时 | 5万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号